LLaMA Factory框架微调GLM-4大模型,傻瓜式教学!!!
使用LLaMAFactory框架傻瓜式微调GLM-4大模型示例
·
这是一个目录
官方链接
如果中途有什么问题可以去开源项目中查看是否有解答,先附上llaMA和GLM-4开源地址
llaMA
GLM-4
前置准备
系统ubuntu24.04
显卡A10
nvidia驱动版本550
conda(环境管理工具,推荐,也可不用)
python环境,本人使用3.12
CUDA版本,本人使用12.0
git工具
LLaMA-Factory部署
创建一个崭新目录,执行以下命令
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"
安装完依赖之后我们启动
llamafactory-cli webui
启动完成之后我们就可以通过http://ip:7860进行访问啦

模型微调
准备模型
我们这里准备的是glm-4-9b-chat-hf模型(等同glm-4-9b-chat)进行微调
首先我们需要把模型下载下来,这里有两种方式
1.直接使用git下载
git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat-hf.git
2.使用modelscope下载
pip install modelscope
#下载模型到当前目录
modelscope download --model ZhipuAI/glm-4-9b-chat-hf ./
微调操作
修改语言
可以将语言先改为中文
选择模型
可以看到这里还支持很多其他模型的微调,我们选择微调glm-4-9b-chat
修改模型路径
修改模型路径为刚才下载的模型的路径
修改训练数据集
可以看到这里面是对于一些关于你是谁,来自于哪的数据集
vim data/identity.json
直接将{{name}} 和 {{author}}替换成自己想要的数据
选择数据集
这里的数据集都是启动目录下的data目录.json的文件汇总
开始训练
选择数据集之后即可开始训练,轮数可以调到10的样子,不然可能训练效果不显著
选择检查点
训练完成之后,选择检查点路径,这里就是输出结果的路径
加载模型

发送问题
问问他是谁
查看结果
可以看到已经给微调成功了
到这里就成功微调了他是谁的这个问题,可以看到微调的话需要大量的数据集来进行训练。
更多推荐

所有评论(0)