过去一周,AI编程领域迎来一轮集中升级,多家头部公司先后亮出“底牌”。

微软这边,Build 2026开发者大会直接将“Agent优先”定为战略核心。GitHub Copilot的定位从“结对编程伙伴”升级为“对等程序员”,能够独立承担Bug修复、功能开发和代码维护任务。同时,微软推出GitHub Copilot的Agent Merge功能,支持多个Agent并行处理跨仓库开发任务,可自主完成PR审查、检查和合并。有分析指出,这标志着AI从代码辅助工具向开发流程自主操作者的角色跃迁。

Anthropic方面,其AI编程Agent Claude Code在SWE-bench(软件工程基准测试)中取得80.8%的得分。SWE-bench评测的是AI解决真实GitHub Issue的能力——给定代码仓库和Bug报告,AI需独立定位问题根因、编写修复代码并通过测试。80.8%的得分意味着Claude Code能在超过五分之四的真实Bug修复任务中独立完成从分析到修复的全流程。

OpenAI方面,其编程模型Codex已并入ChatGPT主模型进行灰度测试。据媒体报道,ChatGPT Mobile正在灰度测试Codex预览版,核心意图是用自然语言在移动端直接调度跨端任务。

image.png

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐