官方链接

如果中途有什么问题可以去开源项目中查看是否有解答,先附上llaMA和GLM-4开源地址
llaMA
GLM-4

前置准备

系统ubuntu24.04
显卡A10
nvidia驱动版本550
conda(环境管理工具,推荐,也可不用)
python环境,本人使用3.12
CUDA版本,本人使用12.0
git工具

LLaMA-Factory部署

创建一个崭新目录,执行以下命令

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

安装完依赖之后我们启动

llamafactory-cli webui

启动完成之后我们就可以通过http://ip:7860进行访问啦

访问webui

模型微调

准备模型

我们这里准备的是glm-4-9b-chat-hf模型(等同glm-4-9b-chat)进行微调

首先我们需要把模型下载下来,这里有两种方式
1.直接使用git下载

git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat-hf.git

2.使用modelscope下载

pip install modelscope
#下载模型到当前目录
modelscope download --model ZhipuAI/glm-4-9b-chat-hf ./

微调操作

修改语言

可以将语言先改为中文
修改语言

选择模型

可以看到这里还支持很多其他模型的微调,我们选择微调glm-4-9b-chat
选择模型

修改模型路径

修改模型路径为刚才下载的模型的路径
修改模型路径

修改训练数据集

可以看到这里面是对于一些关于你是谁,来自于哪的数据集

vim data/identity.json

直接将{{name}} 和 {{author}}替换成自己想要的数据
数据集

选择数据集

这里的数据集都是启动目录下的data目录.json的文件汇总
选择数据集

开始训练

选择数据集之后即可开始训练,轮数可以调到10的样子,不然可能训练效果不显著
开始训练

选择检查点

训练完成之后,选择检查点路径,这里就是输出结果的路径
在这里插入图片描述

加载模型

在这里插入图片描述

发送问题

问问他是谁
发送问题

查看结果

可以看到已经给微调成功了
查看结果

到这里就成功微调了他是谁的这个问题,可以看到微调的话需要大量的数据集来进行训练。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐