中国人民大学《大语言模型》书籍中文版开放下载！还配套代码工具库~

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦！而且是中文版——《大语言模型》！这本书整理呈现了大模型技术框架和路线图，是一本非常好的入门书籍。

程序学到昏

626人浏览 · 2024-12-13 09:57:18

程序学到昏 · 2024-12-13 09:57:18 发布

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦！而且是中文版——《大语言模型》！这本书整理呈现了大模型技术框架和路线图，是一本非常好的入门书籍。🧿🧿🧿

有需要这本《大语言模型综述》书籍PDF文档，可以扫描下方!

以下是书籍大纲，如果有你感兴趣的内容，可以直接下载和阅读啦！

第一部分背景与基础知识

第一章引言

1.1 语言模型的发展历程
1.2 大语言模型的能力特点
1.3 大语言模型关键技术概览
1.4 大语言模型对科技发展的影响
1.5 本书的内容组织

第二章基础介绍

2.1 大语言模型的构建过程
2.2 扩展法则
2.3 涌现能力
2.4 GPT 系列模型的技术演变

第三章大语言模型资源

3.1 公开可用的模型检查点或 API
3.2 常用的预训练数据集
3.3 常用微调数据集
3.4 代码库资源

第二部分预训练

第四章数据准备

4.1 数据来源
4.2 数据预处理
4.3 词元化 (分词)
4.4 数据调度

第五章模型架构

5.1 Transformer 模型
5.2 详细配置
5.3 主流架构
5.4 长上下文模型
5.5 新型模型架构

第六章模型预训练

6.1 预训练任务
6.2 优化参数设置
6.3 可扩展的训练技术
6.4 模型参数量计算与效率分析
6.5 预训练代码实践

第三部分微调与对齐

第七章指令微调

7.1 指令数据的构建
7.2 指令微调的训练策略
7.3 参数高效的模型微调
7.4 代码实践与分析

第八章人类对齐

8.1 人类对齐的背景与标准
8.2 基于人类反馈的强化学习
8.3 非强化学习的对齐方法
8.4 关于 SFT 和 RLHF 的进一步讨论

第四部分大模型使用

第九章解码与部署

9.1 解码策略
9.2 解码加速算法
9.3 低资源部署策略
9.4 其他模型压缩方法

第十章提示学习

10.1 基础提示
10.2 上下文学习
10.3 思维链提示

第十一章规划与智能体

11.1 基于大语言模型的规划
11.2 基于大语言模型的智能体

第五部分评测与应用

第十二章评测

12.1 评测指标与评测方法
12.2 基础能力评测
12.3 高级能力评测
12.4 公开综合评测体系

第十三章应用

13.1 大语言模型在研究领域的应用
13.2 大语言模型在专业领域的应用

有需要这本《大语言模型综述》书籍PDF文档，可以扫描下方!

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

试了6款AI编程工具，我只留这2个

AI Agent技术社区

为什么AI功能越发达，电商客服的差评反而越多？

但一个矛盾的现象正在越来越多的客服管理者之间蔓延：技术预算花了，机器人上线了，可客服团队的疲惫感没有减轻，大促期间的排队时长没有显著缩短，而用户投诉中关于“机器人答非所问”“转人工后要重复说三遍”的声音反而增加了。一线客服不再盯着几十个聊天窗口同时回复，而是监控AI Agent的运行状态，处理那些AI无法独立完成的边缘案例——情绪激动的投诉、涉及多方协调的纠纷、超出知识库范围的新品问题。人员流失率