重磅消息!GLM-5.2 (Max) 在 Code Arena: Frontend 中斩获第 2 名
一句话总结
GLM-5.2 是一个能一口气读完《三体》三部曲、然后帮你写完整个App代码的AI模型。
它到底干了什么?
简单说,智谱AI发布了一个叫 GLM-5.2 的新模型,专门用来写代码、做复杂任务。
听起来不就是又一个AI吗?但它有两个特别牛的地方:
1. 它在“编程奥运会”上拿了银牌
有个叫 Code Arena 的平台,相当于AI编程界的奥运会,全球上百万用户匿名投票打分。
GLM-5.2 在这个比赛里拿了 全球可用模型第一名,在所有模型里排名第二,只输给一个叫 Fable 5 的对手。
它比 Claude Opus 4.7 高了 29 分,是开源模型里表现最好的。
用人话说就是:这个免费开源的AI,编程能力已经接近全世界最顶级的付费模型了。
2. 它能一口气干完一个团队几周的活
GLM-5.2 最大的特点是 “长程任务”能力。
什么叫长程任务?就是那种特别长、特别复杂、需要持续干好几天甚至几周的大项目。
举个例子:官方让它完整做一个覆盖网页、手机App、微信小程序的多端应用——从开发、联调、测试到打包上线,一口气全部搞定。
整个过程处理了 88万个token,几乎用满了它的上下文窗口。
88万token是什么概念?《三体》三部曲加起来大约 90 万字,大概就是这个量级。
以前这种大型工程需要一整个团队干几周,现在 GLM-5.2 一次长程任务就能跑完。
什么是“1M上下文”?为什么重要?
GLM-5.2 支持 100万token的上下文,而且是“无损”的——不是虚标。
打个比方:
普通AI像是一个记性不太好的人,你跟它说一堆话,它后面就忘了前面说了啥。1M上下文 的AI就像有超强记忆力,能把一整本长篇小说从头到尾记住,而且每个细节都不落下。
这对写代码特别重要——一个大型项目可能有几百个文件,普通AI看不过来,但 GLM-5.2 能把整个项目工程全部放进同一条推理链路里,不会顾此失彼。
和其他模型比怎么样?
官方给了一组数据(看不懂没关系,知道很厉害就行):
- 在 FrontierSWE 测试(模拟软件工程师几小时内完成复杂项目)中,比 Claude Opus 4.8 只低 1%
- 在 Terminal-Bench 测试(AI完成各种计算机终端任务)中,比 Claude Opus 4.8 低 4%,但比上一代 GLM-5.1 提升了 17.5%
- 在 MCP-Atlas 测试(大规模工具调用)中,比 Claude Opus 4.8 只低 0.8%
简单说:和全世界最强的AI编程模型只差一口气,但它是开源的、免费的。
对普通人有什么意义?
- 开源免费:遵循 MIT 协议,任何人都可以免费使用、修改,没有地域限制。
- 国产算力:第一天就能跑在国产算力平台上,不依赖国外芯片。
- 开发者已经用上了:在正式发布前,已经有几十万开发者提前体验了,反馈集中在:项目级上下文更强、长任务更稳定、代码质量更可靠。
最后
智谱团队说了一句话挺有意思:“代码还不是AGI(通用人工智能),在通往AGI的路上,还有更多的高山需要翻越。”
GLM-5.2 不是终点,但它让我们看到——一个免费的、开源的、国产的AI,正在一步步逼近全世界最顶尖的编程能力。
对普通人来说,这意味着未来写代码的门槛会越来越低。你不用成为专业程序员,也可能让AI帮你把想法变成真正的产品。
更多推荐



所有评论(0)