又到了一个星期分享AI相关文档的时候了。AI学习不但需要实践,同时也需要阅读一些相关的文档,来增强理论知识。两相结合才能获得更好的效果。

大师兄今天给大家介绍《复旦大学:大语言模型能力来源与边界》。这份文档由复旦大学张奇教授团队撰写,深入探讨了大语言模型(LLM)的能力来源、边界及其在实际任务中的表现。文档通过实验数据和案例分析,揭示了模型在语言核心区、数学推理、工具调用等方面的能力与局限性,并提出了对未来发展的思考。


适用人群:AI研究人员、大模型开发者、技术决策者以及对大语言模型感兴趣的学者和学生。

大师兄仔细阅读了一下发现文章还是很有水平的。从大模型做数学题的方面切入,对当前大模型在推理方面的水平做了剖析。即使不是研究人员,通过整个分析过程也能了解到大模型训练方面的一些实践。


文章章节及梗概

1. 大语言模型语言核心区与维度依赖

  • 语言核心区理论:首次提出语言核心区和维度依赖理论,指导模型训练。

  • 破坏性实验:修改关键参数会导致模型完全混乱,展示核心区的重要性。

2. 大模型能力边界

  • 知识利用层次:模型目前处于记忆阶段,未来需向理解、推理和创造发展。

  • 数学能力测试:在高考数学中表现有限,填空题得分较低,显示推理能力不足。

3. 归纳推理的能力

  • 乘法任务测试:模型在复杂任务中准确率接近零,显示组合性推理的局限性。

  • 训练数据影响:简单加入过程数据对提升作用有限。

4. 大模型工具调用评测

  • 工具使用表现:开源模型与闭源模型在工具调用上存在差距,GPT-4表现最佳。

  • 参数识别问题:输入形式微小变化会导致结果显著差异。

5. 能力来源分析

  • 预训练与微调:预训练决定知识记忆,SFT仅需少量数据即可激活能力。

  • 强化学习作用:RL对推理能力提升有限,但特定认知行为可改善表现。

6. 总结与感想

  • 能力来源:预训练+后训练是核心,RL用于生成任务。

  • 现实意义:模型可快速达到70分,但90分难度大,需理性看待其能力。


文档亮点:结合实验数据与理论分析,为大模型研究提供了实用指导,同时揭示了当前技术的局限性。

部分精彩截图

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

历史文章检索:

扣子(coze)编程

17. [进阶] 扣子(coze)教程 | 效率逆天!全自动抓取网页数据 + 生成表格,手把手教你做工作流

16.「极简」扣子(coze)教程 | 基本组件“选择器”节点高级应用(二)

15.「极简」扣子(coze)教程 | 基本组件“选择器”节点一定要讲讲透(一)

「实用」扣子(coze)教程 | Excel文档自动批量AI文档生成实战,中级开篇

「极简」扣子(coze)教程 | 小程序UI设计进阶(三)让界面动起来,实操讲透“聚焦”事件

「极简」扣子(coze)教程 | 老司机秘籍,扣子调试实践II ,错误信息读取及定位

「极简」扣子(coze)教程 | 成为老司机的秘籍,扣子调试实践 I

「极简」扣子(coze)教程 | 一篇讲透“变量聚合” 节点,让输入更灵活!

「极简」扣子(coze)教程 | 细节决定成败!这个小功能让用户满意度飙升,讲的太细了

「极简」扣子(coze)教程 | 添加插件的另一种方法,上百款插件一键添加,快速扩展你的应用功能!

「极简」扣子(coze)教程 | 上百款插件一键添加,快速扩展你的应用功能!

做小程序不求人 |  零代码神器!0基础秒做专业级App智能体,字节扣子平台抄详细实操纪实

打工人变现新赛道 | 原来做智能体这么简单,5分钟0代码,草履虫实例  【快来学】

「惊觉」未来打工人标配 | 史上第二易懂智能体编程指南来了, 5分钟飞书扣子编程实例 【快收藏】

AI编程与系统

20年经验程序员被AI踢馆现场!AI时代职场危机应对

大师兄数字生命崛起 | 腾讯元器五分钟零成本集成”公众号文章问答“

办公&图文创作

「提效」AI办公 | 小升级大能量!DeepSeek-R1-0528更新藏着这些黑科技

「提效」AI办公 | 效率革命!比 DeepSeek 快 10 倍,从此加班是路人!实测秘塔极速搜索

「提效」AI办公 | 实测,飞书扣子空间快速迭代

立夏爆款!咸鱼最新副业山水藏字接单到手软,工具免费,附保姆级教程

为什么 DeepSeek 复制总带奇怪符号?| 解密AI时代的基础语言markdown

DeepSeek又抽风? | 5.1假期必备,一口气10个DeepSeek 稳定满血入口清单 【快收藏】

90%人不知道的功能 | 飞书多维表格批量自动爬取网上信息,0基础5分钟打造全自动信息加工厂实操【快来试】

一张海报=一部电影 | 一键带你重回电影的黄金年代,即梦3.0让人人都成为海报设计师

信息爆炸时代,怎么能不会这招 | 倍速吸收信息的秘密武器,阿里通意AI,送AI时代择业指南

何止提效10倍,全自动小红书卡片生产攻略 | 只需3步,DeepSeek+多维表格 【先进生产力收藏】

离谱!凌晨保险代理跟我卷AI | 5分钟顶你一天的小红书卡片模板批量生成

清华动手反制美国!又一个国产deepseek时刻?| 能自己动手查资料的智谱“沉思”完整测试

还在用Mermaid+Napkin?| 3步,让大老板深深记住你的名字,制作现场限时公开 【速转家人】

老板露出了赞赏的笑容 | 这个AI绘图神器,让你的 PPT 秒杀麦肯锡,免费 【建议收藏】

只知道Mermaid? 这款独自与visio抗衡20年的免费软件竟让deepseek的生图效率再翻倍 【建议收藏】

废物简历秒变HR心动款!Deepseek教你3步改出必过简历  【建议收藏】

踩坑又踩坑 | 做到这些才能效率翻10倍!用deepseek三分钟绘制各种图表(建议收藏)

别再用KimiPPT助手了 | 比较了三个AI工具后大师兄给牛马的忠告

大师兄登录小红书 |  跟着大师兄学 AI 图文笔记,小红书创作不求人

抢救褪色记忆!手残党福利,AI三步修复老照片

三八妇女节海报设计0成本!用AI工具2步生成精美海报?0基础也能秒懂

体制人必看:DeepSeek智能改稿的3大禁忌与3个提效密码

特朗普VS泽连斯基刷屏 | 别被碎片化信息骗了!这才是AI分析特朗普事件的正确姿势

DeepSeek:选对模型,效率翻倍。   送Deepseek清华AI 5件套

文档系列

「完整」AI文档库 | 吊打清华?大任智库《DeepSeek + 政务办公讲义》第三弹,免费领取!

小红书/Tiktok运营秘籍 | 《大任智库DeepSeek+ 外经贸企业创新突围讲义精华全版》

他为中央政治局第二十次集体学习演讲 | 郑南宁院士《科技赋能教育》

13所大学Deepseek公开课,一次拿走 | 更新浙大第2季《AI大模型如何破局传统医疗 》

不花钱请家教!秘塔这个AI免费功能让学习效率翻倍 | AIGC技术赋能教育数字化转型

未来教育风向标 | 教育学顶流985高校,华东师范大学《AIGC技术赋能教育数字化转型的机遇与挑战》,13所大学deepseek

中美博弈又添筹码,AI模型差距只剩千分之三 | 455页斯坦福2025 AI指数报告全新出炉,附文档免费下载及中文通意辅读工具

没有更全的了,免费拿走 | 12所大学Deepseek公开课,更新至浙大第2季《智能金融:AI 驱动的金融变革》

Deepseek公开课,不能再全了 | 中山大学 《从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用》。

一次下载10个大学的Deepseek系列课 | 更新至哈工大,《从图灵测试到DeepSeek》 82页

清华大学 | 1-14 全网最全合集,《迈向未来的AI教学实验》369页爆肝呈现  【快收藏】

【免费下载】清华大学Deepseek系列之第九篇 |《DeepResearch应用报告》  【建议收藏】

【免费下载】政务七连发 |《北京“数据要素x”典型案例 》《智慧城市大脑建设方案》 【建议收藏】

【免费下载】制造业数字化两件套 | 《德勤制造业人工智能创新应用发展报告》《中国制造企业数字化转型白皮书》

【免费下载】清华厦大deepseek学术王炸两件套

给被315晚会扎心的朋友们补补血 | 《2024年宇树科技商业计划书》【免费下载】

【免费下载】阿里巴巴全域数据中台 | 华为数据中台建设路径:筑梦数字化未来之路

【免费下载】小朋友再不学AI就来不及啦 | “少年商学院|DeepSeek中小学生使用手册(83页)”

[免费下载]浙江大学DeepSeek系列公开课:智能时代的全面到来和人机协作的新常态(含视频课

这一回不要羡慕别人了,快来取 |  北京大学:DeepSeek与AIGC应用

AI五分钟科普

快转给爸爸 | 从平面到动画,5分钟零基础为小棉袄打造属于自己的迪斯尼魔法回忆

5分钟!| 早读课偷偷哼歌被表扬!这招让<出师表>秒变洗脑神曲无需安装!5 分钟体验 AI 文生图魔法(内有豆包安装方法)

AI新闻

「解读」IT新闻 | 微软裁员 6000 人背后:两次亲身体验暴露的必然性,活该还是无奈?

AI 时代,你的工作会被取代吗?| 如何重塑AI时代的个人价值

马拉松新纪元:冠军只是开始,这些「翻车」画面才是重点,机器人马拉松比赛带来的机器人AI赛道的思考

「好奇」从实验室到独角兽 | 人工智能路演现场直击

东大反制速度震惊白宫幕僚!| 川普关税清单竟被AI秒破解?

这5条愚人节AI生成的假新闻你有没有中招  【快转给中招的朋友】

“4月1号,朋友圈一定要这样发”

四大 AI 联合打造 315 晚会曝光清单,这些信息不容错过!

英特尔首次换上华人CEO | AI你怎么看

特朗普VS泽连斯基刷屏 | 别被碎片化信息骗了!这才是AI分析特朗普事件的正确姿势

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐