Codex有哪些功能?2026最新版16大核心功能体验评测

在这里插入图片描述

如果你最近一直在用 Codex,大概率会发现它已经不是当初那个"写几行代码"的 AI 了。

插件、自动化、Computer Use、Plan、Browser、Worktree、Memory……功能越来越多。

问题来了:

哪些功能是真正每天都在用?哪些功能只是发布会看着很酷?

本文就按照个人实际使用体验,纯客观点评一下 Codex 目前比较核心的 16 个功能

为了方便理解,我把它们分成几个等级:

等级 含义
🔥 夯 没有它几乎不想用 Codex
⭐ 顶级 非常强,使用频率高
👍 人上人 高级玩家会特别喜欢
😐 NPC 有用,但不是刚需
👀 拉 有意思,但生产力有限

仅代表个人体验,不代表绝对结论。

Codex客户端下载:https://codexdown.cn/


1.Go(长期目标)

评分:👍 人上人

以前的 Codex 很像临时工。

你说一句,它干一步。

然后马上问:

下一步呢?

Go 出来以后,可以给 Codex 一个长期目标。

例如:

  • 重构整个项目
  • 完成版本迁移
  • 整理大量文件
  • 修复多个 Bug

它会尽量一直往目标推进,而不是每几分钟停下来等你。

优点

  • 长任务体验提升明显
  • 不需要反复补充背景
  • 更接近真正的 Agent

缺点

特别吃 Prompt。

例如:

做高级一点

优化一下体验

这种描述基本等于让 AI 猜谜。

写得越具体,效果越好。


2.Computer Use(电脑操作)

评分:👍 人上人

这是 Codex 最有代表性的能力之一。

它可以:

  • 看屏幕
  • 点击按钮
  • 输入文字
  • 操作桌面软件
  • 浏览网页
  • 控制模拟器

终于补上了以前 GUI 世界的空白。

以前很多事情:

API 做不了。

MCP 做不了。

命令行更做不了。

现在至少 AI 能亲自去点。

缺点也很明显

它不是调用接口。

而是在看屏幕猜界面

所以会出现:

  • 找不到按钮
  • 弹窗挡住
  • 焦点丢失
  • 页面加载慢
  • 窗口切换

整体速度也不快。

更重要的是,它不会替你越权操作。

所以目前来看:

能用,但距离完全自动还有距离。


3.Automation(自动化)

评分:👍 人上人

这个功能很适合重复任务。

例如:

  • 定时检查部署
  • 扫描项目状态
  • 检查依赖更新
  • 定期整理结果

真正适合:

重复且规则固定。

最大误区

自动化不会把烂流程变成好流程。

它只会:

准时重复你的烂流程。

如果本身就需要大量人工判断。

自动化只会稳定地产生更多垃圾。


4.插件(Plugins)

评分:🔥 夯

这是目前我认为最重要的能力之一。

没有插件。

Codex 就只是一个写代码的 AI。

有插件以后。

它开始真正进入工作流。

例如:

  • Browser
  • GitHub
  • Figma
  • Product Design
  • PDF
  • Slides
  • Spreadsheet

这些插件已经覆盖了很多真实办公场景。

相比官方插件。

其实我更推荐:

自己写 Skills。

针对自己的工作流,效率往往更高。


5.MCP

评分:😐 NPC

MCP 本质就是:

让 Codex 能连接真实世界。

例如:

  • 文档
  • 浏览器
  • GitHub
  • Figma
  • 数据库

以前 AI 最大的问题:

不是不会回答。

而是不知道你的项目里发生了什么。

MCP 就是在补这一块。

为什么评分不高?

因为很多插件已经把 MCP 封装好了。

普通用户:

几乎不用自己配置。

真正自己搭 MCP:

认证、权限、连接、上下文……

复杂度并不低。


6.Browser(浏览器)

评分:⭐ 顶级

对于前端来说。

几乎属于必备。

以前:

AI 改页面。

全靠脑补。

现在:

它能:

  • 打开页面
  • 查看效果
  • 截图
  • 重新修改

甚至还能结合批注。

真正做到:

哪里有问题。

改哪里。

唯一限制:

应用内浏览器不会继承你的登录状态。

涉及登录网站。

还是需要 Chrome 等其它方式。


7.Pets(桌面宠物)

评分:👀 拉

可以选择官方宠物。

也可以安装 CQ 自定义宠物。

很可爱。

情绪价值拉满。

生产力基本没有。

Bug 不会因为宠物可爱就少一个。

属于:

每天看着开心一点。


8.Worktree(工作树)

评分:⭐ 顶级

这是 Git 玩家会非常喜欢的功能。

一个项目。

可以开多个独立工作区。

例如:

  • 修 Bug
  • 做实验
  • 重构
  • 自动化

互不影响。

Codex 在后台折腾。

你继续开发。

最后 Hand Off 即可。

缺点就是:

Git 复杂度会上升。

新手容易懵。


9.Record & Replay

评分:⭐ 顶级

Mac 上可以演示一次流程。

Codex 学会以后。

直接变成 Skill。

这是我很看好的方向。

以后教 AI:

未必要写 Prompt。

也可以:

看我做一遍。

例如:

  • 发视频
  • 创建 Issue
  • 固定后台流程

学习成本反而更低。


10.Branch(派生)

评分:👍 人上人

相当于:

当前对话开一个平行世界。

保留原上下文。

尝试另一种方案。

例如:

  • 一个线程修 Bug
  • 一个线程重构
  • 一个线程做实验

不会互相污染。

缺点:

容易开一堆没人收尾的线程。


11.AGENTS.md

评分:🔥 夯

这是最容易被忽略。

也是最值得写的。

它相当于:

项目说明书。

告诉 Codex:

  • 怎么构建
  • 怎么测试
  • 哪些地方不能改
  • 编码规范
  • 工作流程

很多人说:

AI 不懂项目。

其实项目自己也没文档。

那 AI 当然只能猜。

真正稳定的团队。

建议认真维护 AGENTS.md。


12.Codex Mobile

评分:😐 NPC

很多人误以为:

手机写代码。

其实不是。

真正用途:

远程批准任务。

例如:

电脑正在跑。

Codex 请求确认。

你手机点一下即可。

环境仍然来自电脑。

不是手机开发。


13.Plan 模式

评分:⭐ 顶级

这个功能建议复杂任务一定开。

它会:

先分析。

再提方案。

最后执行。

避免:

一句话没说清。

AI 已经重构整个项目。

当然。

如果只是:

改文案。

修拼写。

再规划三阶段。

就有点过度设计了。


14.批注(Annotation)

评分:👍 人上人

浏览器最大的搭档。

可以:

截图。

圈选。

写批注。

例如:

这里按钮太小。

这里挡住内容。

这里间距不对。

以前:

“这里有点怪”

属于玄学。

现在:

直接变成坐标。

对于前端调 UI。

非常实用。


15.Memory(记忆)

评分:😐 NPC

可以记住:

  • 偏好
  • 常用流程
  • 技术栈
  • 一些习惯

减少重复解释。

但不要把它当制度。

真正重要的规则。

还是应该:

写进 AGENTS.md。

Memory 更像辅助。

不是项目规范。


16.Side Chat(侧边聊天)

评分:⭐ 顶级

Cloud Code 很早就有类似思路。

Codex 现在也加入了。

它最大的价值:

主任务继续跑。

你可以旁边单独问:

  • 做到哪了?
  • 为什么这样改?
  • 当前状态?
  • 这个错误严重吗?

不用打断整个任务。

对于长任务体验提升非常明显。


没写 Skills?

不是忘了。

而是因为:

Skills 已经不能用"夯"来形容了。

它几乎决定了:

Codex 最终到底只是聊天机器人。

还是一个真正懂你工作流的 Agent。

很多高频操作。

最终都会沉淀成自己的 Skills。

这一点的重要性,很难用一个等级去评价。


我的最终排名

功能 评级
Plugins 🔥 夯
AGENTS.md 🔥 夯
Browser ⭐ 顶级
Worktree ⭐ 顶级
Record & Replay ⭐ 顶级
Plan Mode ⭐ 顶级
Side Chat ⭐ 顶级
Go 👍 人上人
Computer Use 👍 人上人
Automation 👍 人上人
Branch 👍 人上人
Annotation 👍 人上人
MCP 😐 NPC
Mobile 😐 NPC
Memory 😐 NPC
Pets 👀 拉

总结

如果把 Codex 当成一个代码补全工具,很多功能确实显得复杂。

但如果把它定位为一个能够参与开发流程的 AI Agent,那么插件、项目规范、浏览器、规划模式、工作树等能力,会逐渐成为日常工作的一部分。

真正影响效率的,往往不是某一个单独功能,而是这些能力组合后的工作流。对于不同类型的开发者,各功能的重要程度也会有所不同,因此上面的评级更适合作为一种使用体验分享,而不是固定结论。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐