中国人民大学《大语言模型》书籍中文版开放下载!还配套代码工具库~
大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。
·

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。🧿🧿🧿
有需要这本
《大语言模型综述》书籍PDF文档,可以扫描下方!

以下是书籍大纲,如果有你感兴趣的内容,可以直接下载和阅读啦!
第一部分 背景与基础知识
第一章 引言
- 1.1 语言模型的发展历程
- 1.2 大语言模型的能力特点
- 1.3 大语言模型关键技术概览
- 1.4 大语言模型对科技发展的影响
- 1.5 本书的内容组织
第二章 基础介绍
- 2.1 大语言模型的构建过程
- 2.2 扩展法则
- 2.3 涌现能力
- 2.4 GPT 系列模型的技术演变
第三章 大语言模型资源
- 3.1 公开可用的模型检查点或 API
- 3.2 常用的预训练数据集
- 3.3 常用微调数据集
- 3.4 代码库资源
第二部分 预训练
第四章 数据准备
- 4.1 数据来源
- 4.2 数据预处理
- 4.3 词元化 (分词)
- 4.4 数据调度
第五章 模型架构
- 5.1 Transformer 模型
- 5.2 详细配置
- 5.3 主流架构
- 5.4 长上下文模型
- 5.5 新型模型架构
第六章 模型预训练
- 6.1 预训练任务
- 6.2 优化参数设置
- 6.3 可扩展的训练技术
- 6.4 模型参数量计算与效率分析
- 6.5 预训练代码实践
第三部分 微调与对齐
第七章 指令微调
- 7.1 指令数据的构建
- 7.2 指令微调的训练策略
- 7.3 参数高效的模型微调
- 7.4 代码实践与分析
第八章 人类对齐
- 8.1 人类对齐的背景与标准
- 8.2 基于人类反馈的强化学习
- 8.3 非强化学习的对齐方法
- 8.4 关于 SFT 和 RLHF 的进一步讨论
第四部分 大模型使用
第九章 解码与部署
- 9.1 解码策略
- 9.2 解码加速算法
- 9.3 低资源部署策略
- 9.4 其他模型压缩方法
第十章 提示学习
- 10.1 基础提示
- 10.2 上下文学习
- 10.3 思维链提示
第十一章 规划与智能体
- 11.1 基于大语言模型的规划
- 11.2 基于大语言模型的智能体
第五部分 评测与应用
第十二章 评测
- 12.1 评测指标与评测方法
- 12.2 基础能力评测
- 12.3 高级能力评测
- 12.4 公开综合评测体系
第十三章 应用
- 13.1 大语言模型在研究领域的应用
- 13.2 大语言模型在专业领域的应用
有需要这本
《大语言模型综述》书籍PDF文档,可以扫描下方!

更多推荐


所有评论(0)