LLaMA Factory框架微调GLM-4大模型，傻瓜式教学！！！

使用LLaMAFactory框架傻瓜式微调GLM-4大模型示例

下午茶xwc

1325人浏览 · 2024-11-27 10:55:26

下午茶xwc · 2024-11-27 10:55:26 发布

这是一个目录

官方链接
前置准备
LLaMA-Factory部署
模型微调

官方链接

如果中途有什么问题可以去开源项目中查看是否有解答，先附上llaMA和GLM-4开源地址
llaMA
GLM-4

前置准备

系统ubuntu24.04
显卡A10
nvidia驱动版本550
conda(环境管理工具，推荐，也可不用)
python环境，本人使用3.12
CUDA版本，本人使用12.0
git工具

LLaMA-Factory部署

创建一个崭新目录，执行以下命令

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

安装完依赖之后我们启动

llamafactory-cli webui

启动完成之后我们就可以通过http://ip:7860进行访问啦

访问webui

模型微调

准备模型

我们这里准备的是glm-4-9b-chat-hf模型(等同glm-4-9b-chat)进行微调

首先我们需要把模型下载下来，这里有两种方式
1.直接使用git下载

git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat-hf.git

2.使用modelscope下载

pip install modelscope
#下载模型到当前目录
modelscope download --model ZhipuAI/glm-4-9b-chat-hf ./

微调操作

修改语言

可以将语言先改为中文
修改语言

选择模型

可以看到这里还支持很多其他模型的微调，我们选择微调glm-4-9b-chat
选择模型

修改模型路径

修改模型路径为刚才下载的模型的路径

修改训练数据集

可以看到这里面是对于一些关于你是谁，来自于哪的数据集

vim data/identity.json

直接将{{name}} 和 {{author}}替换成自己想要的数据
数据集

选择数据集

这里的数据集都是启动目录下的data目录.json的文件汇总
选择数据集

开始训练

选择数据集之后即可开始训练，轮数可以调到10的样子，不然可能训练效果不显著

选择检查点

训练完成之后，选择检查点路径，这里就是输出结果的路径
在这里插入图片描述

加载模型

在这里插入图片描述

发送问题

问问他是谁
发送问题

查看结果

可以看到已经给微调成功了
查看结果

到这里就成功微调了他是谁的这个问题，可以看到微调的话需要大量的数据集来进行训练。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

让 Codex 桌面版拥抱 DeepSeek-V4：协议桥接与模型网关接入实践

4SAPI 提供了一套标准的 Chat Completions 接口，完全兼容 DeepSeek V4 Pro 等模型，使用时只需将 base URL 和密钥替换为平台分配的值即可。这样一来，既保留了桥接层的协议转换能力，又获得了网关带来的额外弹性。这样的模型网关，则进一步提升了链路的稳定性和密钥管理的便捷度，尤其适合团队或对服务可用性有更高要求的场景。│Codex 桌面版│ ──────────

AI Agent技术社区

别再迷信“突破限制”：Gemini 3.5-flash 边界测试实战复盘

AI Agent技术社区

想要转型AI Agent开发？现在开始学，还不晚

用 @tool 装饰器定义工具@tool"""搜索互联网获取实时信息。当需要最新数据时使用此工具。"""# 实际接入 Tavily / Serper 等搜索 APIreturnf"搜索结果：关于 {query} 的最新信息..."@tool"""计算数学表达式，如 '2 + 3 * 4'"""# 绑定工具到模型# 模型会自动决定是否调用工具response = llm_with_tools.inv