重磅消息！GLM-5.2 (Max) 在 Code Arena: Frontend 中斩获第 2 名

LKY869912

236人浏览 · 2026-06-17 10:16:45

LKY869912 · 2026-06-17 10:16:45 发布

一句话总结

GLM-5.2 是一个能一口气读完《三体》三部曲、然后帮你写完整个App代码的AI模型。

它到底干了什么？

简单说，智谱AI发布了一个叫 GLM-5.2 的新模型，专门用来写代码、做复杂任务。

听起来不就是又一个AI吗？但它有两个特别牛的地方：

1. 它在“编程奥运会”上拿了银牌

有个叫 Code Arena 的平台，相当于AI编程界的奥运会，全球上百万用户匿名投票打分。

GLM-5.2 在这个比赛里拿了 全球可用模型第一名，在所有模型里排名第二，只输给一个叫 Fable 5 的对手。

它比 Claude Opus 4.7 高了 29 分，是开源模型里表现最好的。

用人话说就是：这个免费开源的AI，编程能力已经接近全世界最顶级的付费模型了。

2. 它能一口气干完一个团队几周的活

GLM-5.2 最大的特点是 “长程任务”能力。

什么叫长程任务？就是那种特别长、特别复杂、需要持续干好几天甚至几周的大项目。

举个例子：官方让它完整做一个覆盖网页、手机App、微信小程序的多端应用——从开发、联调、测试到打包上线，一口气全部搞定。

整个过程处理了 88万个token，几乎用满了它的上下文窗口。

88万token是什么概念？《三体》三部曲加起来大约 90 万字，大概就是这个量级。

以前这种大型工程需要一整个团队干几周，现在 GLM-5.2 一次长程任务就能跑完。

什么是“1M上下文”？为什么重要？

GLM-5.2 支持 100万token的上下文，而且是“无损”的——不是虚标。

打个比方：

普通AI像是一个记性不太好的人，你跟它说一堆话，它后面就忘了前面说了啥。1M上下文 的AI就像有超强记忆力，能把一整本长篇小说从头到尾记住，而且每个细节都不落下。

这对写代码特别重要——一个大型项目可能有几百个文件，普通AI看不过来，但 GLM-5.2 能把整个项目工程全部放进同一条推理链路里，不会顾此失彼。

和其他模型比怎么样？

官方给了一组数据（看不懂没关系，知道很厉害就行）：

在 FrontierSWE 测试（模拟软件工程师几小时内完成复杂项目）中，比 Claude Opus 4.8 只低 1%
在 Terminal-Bench 测试（AI完成各种计算机终端任务）中，比 Claude Opus 4.8 低 4%，但比上一代 GLM-5.1 提升了 17.5%
在 MCP-Atlas 测试（大规模工具调用）中，比 Claude Opus 4.8 只低 0.8%

简单说：和全世界最强的AI编程模型只差一口气，但它是开源的、免费的。

对普通人有什么意义？

开源免费：遵循 MIT 协议，任何人都可以免费使用、修改，没有地域限制。
国产算力：第一天就能跑在国产算力平台上，不依赖国外芯片。
开发者已经用上了：在正式发布前，已经有几十万开发者提前体验了，反馈集中在：项目级上下文更强、长任务更稳定、代码质量更可靠。

最后

智谱团队说了一句话挺有意思：“代码还不是AGI（通用人工智能），在通往AGI的路上，还有更多的高山需要翻越。”

GLM-5.2 不是终点，但它让我们看到——一个免费的、开源的、国产的AI，正在一步步逼近全世界最顶尖的编程能力。

对普通人来说，这意味着未来写代码的门槛会越来越低。你不用成为专业程序员，也可能让AI帮你把想法变成真正的产品。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

HarmonyOS 6（API 23）MCP协议 + HMAF智能体框架：构建「智流编排」PC端多智能体工作流协同平台

AI Agent技术社区

从聊天经验到工程规范：AI Agent 的规则回流机制

AI Agent技术社区

它不再是工具，而是“家人”：深度拆解AI Agent如何重塑你的车内生活

当你随口说一句“我有点困了”，AI Agent不会仅仅机械地回答“好的，请注意休息”，而是会综合当前车速、导航距离，自主决定为你播放一首提神的音乐、将空调温度调低两度，甚至联动座椅开启按摩功能。从“听懂指令”到“理解意图”，从“单一控制”到“跨域协同”，AI Agent正在重塑我们与汽车的交互方式。但到了2026年的今天，车载AI不仅会清晰地回应“好的”，还会像一个默契的“家人”一样，在后台行云流