OpenAI 最近整了个新活儿,叫 Guaranteed Capacity。

看起来又是一串看不懂的英文,没关系。用大白话说就是:

你跟 OpenAI 签个 1 到 3 年的合同,承诺每年保底花多少钱,它就给你把算力留好,再顺手打个折。

我一看就乐了——这不就是健身房办年卡嘛。

你觉得自己肯定天天去练,健身房赌你办完卡第一周热情高涨第二周直接消失。两边都觉得赚了。

但要光是个年卡故事,我也就不写这篇了。这玩意儿水比想象中深。


月入 20 亿的印钞机,缺电

先看几个数。

OpenAI 刚融了 1220 亿美元,估值 8520 亿。每个月进账 20 亿美元,企业客户贡献超过四成。API 一分钟跑 150 亿个 token。

月入 20 亿是什么体量?年化 240 亿,已经不是创业公司了,印钞机本机。

但印钞机有个蛋疼的问题——它要电。

这里说的"电"不是真的电,是算力。训模型要算力,跑推理要算力,你问 ChatGPT 今晚吃啥也要算力。

问题在于,现在全世界都在抢算力。

McKinsey 说全球数据中心砸下去的钱,2030 年能干到 7 万亿美元。IEA 统计,2025 年全球数据中心吃掉了 485 TWh 的电,2030 年还要翻一番。

最离谱的是啥?北美那边买一个变压器,排队 50 周。买个中压开关设备,80 周。

GPU?你先排着,电还没拉到机房呢。

所以 OpenAI 搞这个 Guaranteed Capacity,真的不是想给你打折。

它要的是你白纸黑字签个字,告诉投资人:“你看,这一票客户未来三年保底给我这么多钱。”

有了这个,它才敢去建下一个数据中心,才敢去订下一批 GPU,才敢在 IPO 招股书里写那行"我们已有 XX 亿已签约收入"。

你觉得自己买的是折扣,实际上你买的是一张 OpenAI 拿去融资的证明。

图片

不是想省钱,是怕没得用

那问题来了——谁脑子进水了提前三年把钱锁进去?

答案是那些已经离不开这玩意儿的公司。

你干电商的。智能客服挂的是 GPT,代码助手挂的是 GPT,后台数据清洗挂的还是 GPT。几百万用户每天在你平台上买东西、问客服、看推荐,背后一整套链路全跑在 OpenAI 的 API 上。

忽然有一天,OpenAI 限流了。

或者更扎心——你所在区域的容量满了,请求排队排到天荒地老。

客服开始装死,代码补全转圈圈,数据报表永远加载中。用户以为你跑路了,老板问你是不是系统崩了。

你发现自己连骂人都不知道骂谁。

这时候你就懂了:贵不贵不重要,重要的是你要用的时候它得在。

Guaranteed Capacity 卖的就这一样东西——确定性。

你家平时电费百来块钱,你觉得贵。哪天停电一整天,冰箱化了,手机没电了,空调停了,你蹲在客厅里扇扇子——这时候谁跟你说一度电便宜一毛钱,你会打他。

图片

三年合同,模型三个月一换

但这里埋着整个 Guaranteed Capacity 里最阴间的坑。

模型换代太快了。

GPT-5.4 今年 3 月刚发,GPT-5.2 6 月就要被 OpenAI 宣布退休了。

GPT-5.4 input 每百万 token 2.5 美元,output 15 美元。GPT-5.2 是 1.75 和 14。

好,你签了个三年合同,锁了个价格。很开心。

一年后,新模型出来了。更快、更准、更便宜。

你用不用?

用?那你锁的那个折扣,算的哪张价格表?旧模型的价格,还是新模型的价格?谁跟你说了吗?没有。

不用?隔壁竞对已经上了,人家客服比你聪明多了。

更骚的是:旧模型有一天直接关停了,你合约里没用完的额度怎么办?

自动给你切新模型?按什么价格切?额度算不算?

这些事儿,OpenAI 官网一个字没提。

你品,你细品。

三年的合约锁三年的价,但模型三个月一更新。等你反应过来,发现自己锁的价格已经对不上你要用的模型了。

你买的不是折扣,是一张在高速上锁死 60 码的罚单。

图片

这套路不是 OpenAI 发明的

说句公道话。你要是觉得 OpenAI 这波创新了,那是你没怎么跟云厂商打过交道。

Google、Azure、AWS 早就这么干了。

Google Vertex AI 有 Provisioned Throughput。固定期限,指定模型和区域,期限内不可取消。就算你压根没用完,或者那个模型被下架了——账单照扣,没商量。

Azure AI Foundry 也有 Provisioned Throughput Reservations。1 个月到 1 年的预留,承诺期内改不了,取消扣费。

Amazon Bedrock 同理,按 Model Units 买专用吞吐量。

你看,剧本一模一样:把"你爱用不用"的按量付费,改成了"先把钱锁住再说"的预留合约。

OpenAI 的区别在哪?

它把期限拉到了 1-3 年,把计费口径从"这个模型这个区域"放大到"你一年保底花多少",还强调能跨产品线用。

它搞的不是新发明,是升级版。

云厂商玩了十几年的老套路,它拿过来改巴改巴,套在大模型身上,包装成"为了保证您拥有最前沿的 AI 体验"。

行吧,你大,你说了算。

图片

模型打架结束了,CFO 打架才开始

大模型这一仗,打到今天,大概分了三个阶段。

第一阶段比谁聪明。GPT-4 跟 Claude 互相卷,拼推理、拼长上下文、拼多模态。

第二阶段比谁便宜。价格战打了挺久,token 单价一降再降,缓存、批处理、模型蒸馏全安排上。

现在打到第三阶段了:比谁能让更多企业把未来三年的预算签进自己的合同里。

这事就不再是给 CTO 发技术白皮书能解决的了。

你得去 CFO 办公室。

你得聊容量保证、价格保护条款、旧模型下架了额度怎么办、数据到底落哪、出了故障赔多少、出口管制政策变了能不能止损退出。

打着 AI 的旗号,干着 Oracle 的活儿。

图片

最后扯几句

Guaranteed Capacity 这玩意儿,OpenAI 设计得确实漂亮。

客户签长约 → 收入好预测 → 拿这个去融资建数据中心 → 成本摊下来 → 签更多客户。

但飞轮转起来有个前提:客户得续约、模型得继续领先、成本得真能降。

哪个环节掉了链子,飞轮变绞肉机,砸在手里的数据中心比债还烫手。

所以下次再刷到"OpenAI 推出企业级新服务"的新闻,别光盯着折扣百分之几。

想想谁在签这个字,想想他三年后怎么跟老板解释为什么不早点换那家更便宜的。

图片


参考: OpenAI Guaranteed Capacity·OpenAI Services Agreement·OpenAI 融资公告·McKinsey 数据中心报告·IEA 能源与 AI·Google Vertex AI Provisioned Throughput·Azure AI Foundry Reservations·Amazon Bedrock Provisioned Throughput· Anthropic Claude Pricing

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐