大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。🧿🧿🧿

有需要这本《大语言模型综述》书籍PDF文档,可以扫描下方!

以下是书籍大纲,如果有你感兴趣的内容,可以直接下载和阅读啦!

第一部分 背景与基础知识

第一章 引言

  • 1.1 语言模型的发展历程
  • 1.2 大语言模型的能力特点
  • 1.3 大语言模型关键技术概览
  • 1.4 大语言模型对科技发展的影响
  • 1.5 本书的内容组织

第二章 基础介绍

  • 2.1 大语言模型的构建过程
  • 2.2 扩展法则
  • 2.3 涌现能力
  • 2.4 GPT 系列模型的技术演变

第三章 大语言模型资源

  • 3.1 公开可用的模型检查点或 API
  • 3.2 常用的预训练数据集
  • 3.3 常用微调数据集
  • 3.4 代码库资源

第二部分 预训练

第四章 数据准备

  • 4.1 数据来源
  • 4.2 数据预处理
  • 4.3 词元化 (分词)
  • 4.4 数据调度

第五章 模型架构

  • 5.1 Transformer 模型
  • 5.2 详细配置
  • 5.3 主流架构
  • 5.4 长上下文模型
  • 5.5 新型模型架构

第六章 模型预训练

  • 6.1 预训练任务
  • 6.2 优化参数设置
  • 6.3 可扩展的训练技术
  • 6.4 模型参数量计算与效率分析
  • 6.5 预训练代码实践

第三部分 微调与对齐

第七章 指令微调

  • 7.1 指令数据的构建
  • 7.2 指令微调的训练策略
  • 7.3 参数高效的模型微调
  • 7.4 代码实践与分析

第八章 人类对齐

  • 8.1 人类对齐的背景与标准
  • 8.2 基于人类反馈的强化学习
  • 8.3 非强化学习的对齐方法
  • 8.4 关于 SFT 和 RLHF 的进一步讨论

第四部分 大模型使用

第九章 解码与部署

  • 9.1 解码策略
  • 9.2 解码加速算法
  • 9.3 低资源部署策略
  • 9.4 其他模型压缩方法

第十章 提示学习

  • 10.1 基础提示
  • 10.2 上下文学习
  • 10.3 思维链提示

第十一章 规划与智能体

  • 11.1 基于大语言模型的规划
  • 11.2 基于大语言模型的智能体

第五部分 评测与应用

第十二章 评测

  • 12.1 评测指标与评测方法
  • 12.2 基础能力评测
  • 12.3 高级能力评测
  • 12.4 公开综合评测体系

第十三章 应用

  • 13.1 大语言模型在研究领域的应用
  • 13.2 大语言模型在专业领域的应用

有需要这本《大语言模型综述》书籍PDF文档,可以扫描下方!

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐