今天发现一本不错的综述

可以作为入门大模型技术的书籍

在这里插入图片描述

01

你一定在各类研报、文章等渠道中看过这张图,而它就出自这篇综述。

在这里插入图片描述

  1. 综述爆火,如今更新到第 13 个版本,包含了 83 页的正文内容,并收录了 900 余篇参考文献。

论文地址:https://arxiv.org/abs/2303.18223

  1. 在 2023 年 12 月底启动了中文书的编写工作,并且于 2024 年 4 月 15 日左右完成初稿。

项目地址:https://llmbook-zh.github.io/

02

该书共 391 页,参考文献共 447 篇,旨在为对大模型技术感兴趣的初学者提供全面介绍,展示整体框架和发展方向。

在这里插入图片描述
该书一共五大部分,包括大模型基础、大模型预训练、大模型微调、提示词、智能体、大模型在研究/专业领域的应用等

在这里插入图片描述
里面有非常多精彩的解读与数据整理,比如 LLaMA 系列模型衍生工作进化图。

在这里插入图片描述
比如混合专家模型的介绍。

在这里插入图片描述
也有当下热门的智能体(Agent)相关介绍。

在这里插入图片描述
再比如各专业领域内代表性的大语言模型与数据资源。

在这里插入图片描述
希望通过阅读本书,大家能够深入了解大模型技术的现状和未来趋势,为自己的研究和实践提供指导和启发。

篇幅有限,这里就不一一展示了,这份完整版的PDF 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐