Karpathy 加入 Anthropic:OpenAI 创始成员转投 Claude,AI 人才战进入新阶段

5 月 19 日(周二),Andrej Karpathy 通过个人账号宣布加入 Anthropic。他在贴文中写道:“I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D.”
在这里插入图片描述

这条单方面声明的分量,在过去十年的 AI 圈里很难找到对照组:Karpathy 是 OpenAI 的创始成员之一,先后两度在 OpenAI 任职;他也是 Tesla 的前 AI 负责人,主导 Autopilot 视觉栈架构升级;离开 Tesla 后,他创办了 AI 教育创业公司 Eureka Labs,在 X 上提出"vibe coding"这一被开发者大规模引用的范式。

而现在,他选择把"接下来几年"押给了 Claude 的母公司。

一、时间线与岗位:他将做什么

时间 事件
2026-05-19 Karpathy 本人发文宣布入职 Anthropic
2026-05-19 同日,Meta 前网络安全资深专家 Chris Rohlf 加入 Anthropic frontier red team
2026-05-20 Fortune Tech 头条以"Anthropic’s big hire"形式重点报道
本周内 Karpathy 正式开始在 Anthropic 工作

岗位口径在不同信源略有差异,但相互不矛盾:

  • The New StackTechnobezz:加入 Claude 预训练(pre-training)团队
  • ReutersCNBC:领衔 autoresearch(自动化研究)团队

合并解读:Karpathy 的角色覆盖 基础模型预训练 + 自动化科研工具链——前者是 Claude 下一代能力的底盘,后者是把研究流程本身做成可被模型加速的"研究生产线"。这两块组合在一起,正是当下前沿实验室追赶并扩大对竞品优势所需要的最稀缺人才类型。

二、为什么这条新闻值得关注:三重势能叠加

Karpathy 的入职不是孤立事件,它处在 Anthropic 多条线同时起势的节点上:

1. 资本与算力

  • 2026 年 4 月:Google 承诺向 Anthropic 投入最高 400 亿美元(现金 + 算力),其中 100 亿即时注资
  • 2026 年 5 月初:Anthropic 与 Google Cloud 签下 5 年 2000 亿美元 算力大单
  • 2026 年 5 月中:路透 / NYT 报道 Anthropic 正在以接近 9500 亿—1 万亿美元 估值进行新一轮融资,距离 2 月份的 3800 亿仅过去三个月

2. 团队与组织

  • 4 月:Microsoft AI 平台总裁 Eric Boyd 出任 Anthropic 基础设施负责人,对应美国本土 500 亿美元数据中心计划

  • 5 月:Karpathy(预训练 / autoresearch)+ Chris Rohlf(frontier red team)同日落地在这里插入图片描述

  • SignalFire 的研究指出,Anthropic 在两年期员工保留率上达到 80%,且薪酬中位数低于 OpenAI

3. 产品与商业化方向

  • 5 月初:Anthropic 推出企业服务咨询业务,OpenAI 随后跟进 40 亿美元服务公司
  • 5 月中:Anthropic 表态 Claude 永远不会引入广告,与 GPT、Gemini 的商业化方向形成明显分叉
  • 限量发布的新一代前沿模型 “Mythos” 已被分发给数十家企业与美国政府合作伙伴

把这三条线对齐,可以读出 Karpathy 选择 Anthropic 的隐含信号:一家有钱、有算力、有组织治理、且在产品立场上更克制的实验室,下一步要把对预训练的投入和"自动化科研"工具链一起拉满。这与他过去在 OpenAI、Tesla 都做过的事——把一个团队的研究效率系统性翻倍——非常吻合。

三、对一线开发者意味着什么

短期内,这条人事新闻不会改变你今天调用 Claude API 的接口形态、价格表,或可用模型清单。但中期值得关注三条:

3.1 预训练投入加码 → 模型能力代际更新会加速

Karpathy 牵头预训练,意味着下一代基础模型的迭代节奏会被推得更紧。建议在生产环境抽象一层 Provider 配置,便于将来低成本切换。一个常见的写法:

import os
from anthropic import Anthropic

client = Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
    base_url=os.environ.get("ANTHROPIC_BASE_URL", "https://api.anthropic.com"),
)

# 模型名也走环境变量,下一代模型上线时只改 env,不改代码
MODEL = os.environ.get("CLAUDE_MODEL", "claude-opus-4-7")

resp = client.messages.create(
    model=MODEL,
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello"}],
)
print(resp.content[0].text)

base_urlmodel 全部抽到环境变量,是面对 LLM 提供方频繁迭代时最低成本的解耦手段。

3.2 autoresearch 团队 → Agent 与工具调用会更深

"自动化科研"工具链一旦内化进 Claude 的产品形态,开发者可触达的 Agent / Tool Use / 长任务推理能力会显著扩张。建议关注 Anthropic 官方 Tool Use 文档 与 MCP(Model Context Protocol)生态在 6—9 月的更新节奏。

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

const resp = await client.messages.create({
  model: "claude-sonnet-4-6",
  max_tokens: 2048,
  tools: [
    {
      name: "search_arxiv",
      description: "在 arXiv 上检索最新论文",
      input_schema: {
        type: "object",
        properties: {
          query: { type: "string" },
          max_results: { type: "integer", default: 10 },
        },
        required: ["query"],
      },
    },
  ],
  messages: [
    { role: "user", content: "查一下 Karpathy 在 LLM 预训练方面的近期论文" },
  ],
});

Tool Use 这一年从"能用"走到"好用"的节奏明显加快,预期 autoresearch 团队会进一步压缩这条路径上的工程成本。

3.3 算力扩张 → 稳定性与配额会更松

2000 亿美元 5 年云算力 + 500 亿数据中心兜底意味着调用峰值不再是稀缺品。中后台批处理、长上下文、高并发的应用窗口被打开,原本因为 rate limit / 长尾延迟被压在 PoC 阶段的方案,可以重新评估。

四、人才战的另一面:流向也在反向发生

需要避免单边解读。OpenAI 与 Anthropic 之间的人才流动从来不是单向的:

  • 历史上 OpenAI 也从 Anthropic 挖过若干核心研究员
  • DeepMind、Meta、Mistral 同样在持续吸纳两边的人
  • Karpathy 自己也强调"回到 R&D"是他的主要动机,意味着选择的是研究环境,而非简单的"站队"

但 Karpathy 这次的象征意义在于:一个曾经定义 OpenAI 早期研究文化的人,公开地把自己的精力下注到 Anthropic 的下一代基础模型上。这条信号在企业客户、人才市场、监管视角上都会被放大解读。

五、几个值得在未来 60 天观察的问题

问题 观察口径
Karpathy 团队的第一篇 Anthropic 署名研究何时出现 arXiv / Anthropic Research 博客
autoresearch 是否会孵化对外可见的产品形态 Anthropic 产品博客、API release notes
Mythos / 下一代基础模型的公开放量节奏 Anthropic 官方公告
OpenAI 是否会在人才与组织层面回应 Sam Altman 公开发言、OpenAI 招聘动作
Karpathy 此前的开源教育内容(Eureka Labs、nanoGPT 系列)是否会被新岗位影响 他本人的 GitHub / X 动态

六、结语

AI 头部公司之间的人才流向,从来比融资公告更能预测下一阶段的产品形态。Karpathy 把"接下来几年"押在 Anthropic 的预训练和 autoresearch 上——这意味着 Claude 的能力上限和工具链广度,都将在未来 12–18 个月被显著推高。对工程师而言,把 SDK、base_url、模型 ID 都抽象到环境变量层,是迎接这一波节奏最便宜的准备工作。

如果想了解 Claude 系列模型的国内调用路径与人民币结算方案,可以参考 claudeapi.com

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐