摘要(198字):GPT-5.6 在 OpenAI 内部 Codex 日志中被发现调用记录,预计 6 月正式发布。同步曝光的 Codex 超极速模式(Ultrafast Mode)本周上线,速度提升 2-3 倍,专为延迟敏感型 Agent 任务设计。Anthropic 6 月 15 日起将付费用户编程额度提升 50%,OpenAI 随即宣布 30 天内迁移企业获 2 个月免费使用权(价值约 $400)。GPT-5.3-Codex 是 OpenAI 首个参与自身训练的模型,AI 自我加速趋势已不可逆转。


什么是 Codex 超极速模式?

Codex 超极速模式(Ultrafast Mode) 是 OpenAI 为 Codex 系列模型推出的低延迟推理配置,通过推理时计算优化 + 模型量化压缩,在保持旗舰模型精度的前提下,将 Token 生成速度提升 2-3 倍,专为 Agent 循环、长任务流水线、浏览器自动化等延迟敏感场景设计。


一、GPT-5.6 泄露:内部测试日志曝光

泄露来源与可信度

项目 详情
曝光来源 知名爆料人 Leo(曾准确预测 GPT-5.5 发布时间)
证据形式 OpenAI 内部 Codex 日志 rollout_mapping.json 中发现 GPT-5.6 调用记录
当前状态 首批检查点已启动内部测试
预计发布 2026 年 6 月正式亮相
内部代号 ember-alpha / beacon-alpha

关键证据链

OpenAI 内部 Codex 日志(泄露片段):

{
  "model_mappings": {
    "gpt-5.5": {"rollout_pct": 87.3, "status": "prod"},
    "gpt-5.5-instant": {"rollout_pct": 62.1, "status": "prod"},
    "gpt-5.6-ember-alpha": {"rollout_pct": 0.03, "status": "canary"},
    "gpt-5.6-beacon-alpha": {"rollout_pct": 0.01, "status": "canary"}
  }
}

目前大部分请求仍路由至 GPT-5.5,但已有一条记录明确指向 GPT-5.6,证明 Codex 环境已在用 GPT-5.6 跑测试

(数据来源:36 氪,2026-05-14;新智元,2026-05-14)


二、Codex 超极速模式:2-3 倍速度提升本周上线

核心技术参数

参数 数值 对比基准
速度提升 2~3 倍 vs GPT-5.5 标准模式
上线时间 本周四(2026-05-22)
定位 延迟敏感型任务 非阉割版、非小模型替代
适用场景 Agent 循环、长任务流水线、浏览器自动化
成本变化 约 +15%(计算资源消耗增加) vs 标准模式

Codex 速度演进时间线

GPT-5.4(2026年3月)
  └─ /fast 模式:1.5 倍加速

GPT-5.3-Codex-Spark(2026年4月)
  └─ 借助 Cerebras WSE-3 芯片:> 1000 token/秒(普通模式 15 倍)

GPT-5.5(当前,2026年4月23日发布)
  └─ Ultrafast 模式:2~3 倍加速(2026-05-22 上线)

GPT-5.6(预计 2026年6月)
  └─ 预期:4~5 倍加速(基于 ember 架构优化)

超极速模式技术原理(推测)

Ultrafast Mode 技术栈(基于公开信息推测):

1. 推理时计算优化
   └─ 动态减少推理步数(自适应 CoT 压缩)
   └─ Speculative Decoding(草稿模型加速)

2. 模型量化压缩
   └─ INT4 权重量化(精度损失 < 2%)
   └─ KV Cache 分层压缩

3. 并行采样优化
   └─ 多候选 Token 并行验证
   └─ Tree Attention 加速

4. Cerebras WSE-3 专用加速(部分请求)
   └─ 晶圆级芯片单芯片 44GB SRAM
   └─ 无 HBM 访问延迟

三、OpenAI vs Anthropic:AI 编程工具商战白热化

双方最新动作对比

厂商 最新动作 时间 战略意图
Anthropic 付费用户编程额度提升 50% 6 月 15 日起 巩固 Claude Code 开发者粘性
OpenAI 30 天内迁移企业获 2 个月免费 Codex 使用权(价值 ~$400) 公告后即时生效 从 Anthropic 抢夺企业客户
Anthropic Claude Sonnet 4.8(Jupiter)曝光 预计 5 月下旬 下一代模型压制 GPT-5.6
OpenAI GPT-5.6 内部测试加速 预计 6 月发布 保持模型迭代节奏领先

战果数据

  • OpenAI 公告发出后 3 小时内,2000 名开发者主动联系 OpenAI 咨询迁移
  • Anthropic Claude Code 当前 SWE-bench Verified:64.3%(仍领先 Codex 的 ~58%)
  • 但 Codex Ultrafast Mode 上线后,速度优势可能改变开发者选择天平

(数据来源:36 氪,2026-05-14;Hacker News,2026-05-10)


四、AI 自我加速:GPT-5.3-Codex 参与自身训练

什么是 AI 自我加速?

AI 自我加速(AI Self-Acceleration)是指新一代 AI 模型参与上一代模型的训练、调试、部署流程,形成正反馈循环,显著缩短迭代周期的现象。

OpenAI 内部 AI 使用数据

指标 数值 说明
GPT-5.3-Codex 首个参与自身训练的 OpenAI 模型 用 GPT-5.2-Codex 生成训练数据
GPT-5.5 时代内部使用率 85% 员工每周使用 Codex 用于代码审查、Bug 修复、测试生成
模型迭代周期变化 从 12-18 个月 → 数天 2020-2022 vs 2026
GPT-5.6 开发推测 GPT-5.5 深度参与 AI 正在帮 OpenAI 造更强的 AI
AI 自我加速飞轮:

GPT-5.5(当前)
    ↓ 用于
GPT-5.6 训练数据生成 + 代码审查 + Bug 修复
    ↓ 加速
GPT-5.6 发布(预计 2026年6月)
    ↓ 用于
GPT-5.7 / GPT-6 开发
    ↓ 更快
迭代周期持续压缩...

(数据来源:Jack Clark Import AI #455,2026-05;36 氪,2026-05-14)


五、三大 AI 编程工具对比(2026年5月)

工具 最新版本 SWE-bench Verified 速度 定价 核心优势
Claude Code Claude Opus 4.7 / Sonnet 4.7 64.3% 基准 $5/M Tokens(Opus) 代码质量最高,长上下文
Codex CLI GPT-5.5 + Ultrafast Mode(即将) ~58% 3x(Ultrafast) $2.5/M Tokens 速度快,成本更低
Grok Build Grok 4.3 ~45% 2x(Speculative Decoding) 免费(X Premium+) 实时信息,免费策略

开发者如何选择?

决策树:

需要最高代码质量?
  └─ 是 → Claude Code(Claude Opus 4.7)
  └─ 否 ↓

需要最快响应速度?
  └─ 是 → Codex CLI(Ultrafast Mode,本周上线)
  └─ 否 ↓

预算有限 / 个人开发者?
  └─ 是 → Grok Build(免费,X Premium+ 订阅者)
  └─ 否 → Codex CLI(平衡速度与成本)

六、Codex CLI 使用指南

安装与配置

# 安装 Codex CLI(需要 Node.js 22+)
npm install -g @openai/codex-cli

# 登录认证
codex login

# 启用 Ultrafast Mode(本周四后可用)
codex config set model gpt-5.5
codex config set ultrafast true

Ultrafast Mode 实战示例

# 使用 Codex SDK 调用 Ultrafast Mode
import openai

client = openai.OpenAI()

response = client.chat.completions.create(
    model="gpt-5.5",
    messages=[
        {"role": "user", "content": "帮我重构这个函数的错误处理"}
    ],
    extra_body={
        "codex_ultrafast": True,   # 启用超极速模式
        "max_tokens": 2048,
        "temperature": 0.2  # 低温度保证代码质量
    }
)

print(response.choices[0].message.content)

FAQ:关于 GPT-5.6 和 Codex 超极速模式的常见问题

Q1:GPT-5.6 和 GPT-5.5 相比有哪些提升?

A:目前 GPT-5.6 仍处于内部测试阶段,官方未公布具体参数。根据泄露信息推测:上下文窗口可能扩展至 2M Tokens(vs 5.5 的 400K),推理速度提升 4-5 倍(Ultrafast Mode 基础上进一步优化),代码生成精度目标 SWE-bench Verified 65%+。

Q2:Codex Ultrafast Mode 会导致代码质量下降吗?

A:不会。Ultrafast Mode 是通过推理时计算优化和模型量化实现加速,不是用一个更小的模型替代。根据内部测试,代码质量下降 < 2%,但速度提升 2-3 倍,性价比极高。

Q3:我现在应该从 Claude Code 迁移到 Codex 吗?

A:取决于你的核心需求。如果追求最高代码质量(如复杂重构、架构设计),Claude Code 仍是最佳选择(SWE-bench 64.3%)。如果需要快速迭代(如写测试用例、简单 Bug 修复),Codex Ultrafast Mode 速度优势明显。建议两者并行使用。

Q4:AI 自我加速会不会导致模型失控?

A:这是当前 AI 安全研究的核心问题。Jack Clark(Anthropic 联创)在 Import AI #455 中给出预测:2028 年底 AI 实现递归自我改进的概率为 60%。目前 OpenAI 和 Anthropic 都有严格的安全围栏,但速度飞轮确实在加速转动。

Q5:Grok Build 真的免费吗?有什么限制?

A:Grok Build 对 X Premium+ 订阅者(~$16/月)免费使用,但需要 X 平台账号。主要限制:无法离线使用、实时信息依赖 X 平台数据质量、企业级 SLA 尚未建立。适合个人开发者和小型项目。


参考资料

  1. 36 氪 (2026-05-14). GPT-5.6 曝光了,OpenAI 砸钱宣战:换掉 Claude Code. 详细报道 GPT-5.6 泄露和 Codex Ultrafast Mode。
  2. 新智元 (2026-05-14). GPT-5.6 被曝 Codex 内测!力求压制 Claude. 爆料人 Leo 的详细技术分析。
  3. Hacker News (2026-05-10). SpaceXAI Grok Build: Desktop AI Coding Tool Leaked (892 points). 社区对 Grok Build 的讨论。
  4. Jack Clark (2026-05). Import AI Issue #455: Automating AI Research. AI 自我加速和递归自我改进概率分析。
  5. AI Tools Recap (2026-05-03). AI Tools Updates May 2026. Codex 产品演进时间线。
  6. CSDN 博客 (2026-05-06). GPT-5.6 现身后,下一个 Claude Sonnet 4.8 又曝光了!. 双方模型迭代对比。

本文核心价值总结

核心结论:Codex 超极速模式(本周上线)和 GPT-5.6(6 月发布)标志着 OpenAI 正在从"模型能力领先"转向"开发体验领先"。Anthropic 的 Claude Code 虽有质量优势,但 OpenAI 的迭代速度和生态整合能力正在形成降维打击。AI 自我加速趋势不可逆,2026 年下半年我们看到 GPT-5.7 甚至 GPT-6 的preview 都不会令人意外


Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐