LLaMA-Factory使用经验记录,请查看 文件简介 根据个人情况,选择合适的内容学习。
文件夹名称 | 作用 | 训练方式 | 备注 |
---|---|---|---|
data | 数据集示例 | ||
data_structure | 数据集格式解释 | 仅介绍Alpaca格式 | |
easy_to_use | 直接加载模型进行测试,体验LLaMA-Factory的使用 | Colab方式 | |
easy_to_train_model | 使用项目本身数据集训练模型 | LoRA | Colab方式 |
custom_dataset_train | 使用自定义数据集训练模型 | LoRA | 服务器启动UI方式 |
command_parse | 讲解llamafactory-cli 命令的执行逻辑 |
追踪到代码层,确定命令对应的代码 | |
how_to_debug | 介绍如何通过debug方式启动llamafactory | 笔者使用的vscode | |
cuda_docker_run | 介绍以docker方式启动llamafactory | 适用于CUDA用户 |
文件名称 | 作用 | 备注 |
---|---|---|
split_dataset.py | 切分数据集 | 用于Alpaca格式 |
update_self_awareness.py | 更新模型自我认知数据集 | 注意修改文件中的模型名称、作者名称 |
glm4_stream_cli_demo.py | transformers 后端以命令行进行模型推理 | 流式输出 |
glm4_stream_web_demo.py | transformers 后端以web界面进行模型推理 | 流式输出 |
(myenv) root@ubuntu22:/data/LLaMA-Factory-main# llamafactory-cli env
- `llamafactory` version: 0.8.4.dev0
- Platform: Linux-6.2.0-35-generic-x86_64-with-glibc2.35
- Python version: 3.11.9
- PyTorch version: 2.4.0+cu121 (GPU)
- Transformers version: 4.43.4
- Datasets version: 2.20.0
- Accelerate version: 0.32.0
- PEFT version: 0.12.0
- TRL version: 0.9.6
- GPU type: NVIDIA A100-PCIE-40GB
感谢 hiyouga 的贡献,才能有 LLaMA-Factory 这么方便的工具。