两个200亿美元:OpenAI和英伟达押注芯片,在打一场“推理之战”
发布时间:2026-04-21 20:10 浏览量:1
2025年底到2026年中,两个200亿的动作,直接把AI圈的天捅破了——全球最大的AI芯片卖家英伟达,砸200亿买下了推理芯片公司Groq;全球最大的AI买家OpenAI,花200亿采购另一家推理芯片公司Cerebras,还悄悄拿到了对方的认股权。
这不是两件孤立的事,是一场没有硝烟的战争,战场名字叫AI推理。绝大多数人没注意到,但它的影响,可能比过去两年所有AI发布会加起来都深远——因为它在重新分配史上最大科技市场的控制权。
在讲这两个200亿之前,得先搞懂一个关键变化:AI芯片的战场重心,正在从训练转向推理。训练是造模型,把海量数据喂给AI让它学会能力,比如GPT-4只训了一次;推理是用模型,每次你问ChatGPT问题,它回答一次就是一次推理请求。
2023年时,全球AI算力支出大头还是训练,但现在这个比例彻底倒过来了。德勤和CES 2026的数据显示,2026年推理会占全部算力支出的2/3,联想CEO杨元庆更直白:AI支出结构会从80%训练变80%推理。
原因很简单:训练是一次性成本,推理是持续消耗——GPT-4每天要回答亿级用户的问题,累积起来的算力需求远超训练。这意味着,AI最赚钱的蛋糕,正在从训练芯片滑向推理芯片,而这两种芯片的设计逻辑完全不同。
英伟达的H100、H200是训练芯片里的怪兽,擅长多核并行计算,能处理海量矩阵乘法。但推理的瓶颈不是计算,是内存带宽。
当你发一个问题,芯片得把整个模型的权重从内存搬到计算单元里才能生成回答,这个“搬运”过程才是延迟的根源。英伟达GPU用的是外接HBM内存,搬运距离长,延迟高——对每秒处理几千万次请求的ChatGPT来说,这个延迟乘以规模,就是致命的性能瓶颈。
OpenAI工程师优化Codex时就发现,无论怎么调参,响应速度都受限于英伟达GPU的架构上限。换句话说,英伟达在推理端的劣势,不是努力不够,是天生架构问题。而Cerebras的WSE-3芯片走了另一条路:晶圆级封装,面积比手掌还大,把90万个AI核心和44GB超高速SRAM内存集成在同一块硅片上,内存直接贴在计算核心旁边,搬运距离从厘米缩到微米,推理速度比H100快15到20倍。
英伟达也没坐以待毙,最新的Blackwell架构推理性能提升4倍,但追的是移动靶——Cerebras也在迭代,而且竞争对手不止它一家。
2025年12月,英伟达宣布史上最大并购:花200亿买Groq。Groq和Cerebras是同类,主打推理优化的SRAM架构芯片,当时公开测评里是全球最快的推理芯片服务。这笔钱是英伟达2019年收购Mellanox的3倍。分析师都看出来了:这笔钱不是简单买公司,是英伟达承认自己在推理端有结构性缺口,而且大到值得花200亿去堵。
如果英伟达真觉得自己的GPU在推理端无敌,根本不用收购Groq。这笔钱本质上是一张200亿美元的“认证书”——承认SRAM嵌入式架构在推理场景的优势,承认自己现有产品线覆盖不了,用最贵的价格买了个填不上的技术缺口。官方说“整合Groq提供完整推理方案”,翻译过来就是:我们的东西不够用,所以买了别人的。
OpenAI的动作更耐人寻味。2026年1月,它和Cerebras签了100亿三年采购协议,当时媒体只说“多元化供应商”。但4月曝光的细节让事情变了性质:采购金额翻到200亿,OpenAI获得Cerebras认股权证,持股最高达10%,还提供10亿帮Cerebras建数据中心。
这哪里是买芯片?分明是孵化供应商。科技史上有先例:2006年苹果和三星合作定制A系列芯片,后来自研M系列,彻底掌握供应链。OpenAI现在做的类似,但边界不同:苹果一开始就握设计权,OpenAI目前还是采购者,Cerebras上市后也会独立。
它的目标不是完全掌控Cerebras,而是建立深度互依的生态。同时,OpenAI还和博通合作研发自有ASIC芯片,预计2026年底量产——两条腿走路,终点是算力自主。
4月17日,Cerebras提交IPO申请,目标估值350亿,融资30亿。这个估值比2025年9月的81亿涨了4倍多,今年2月融资时估值230亿,IPO又溢价52%。它之前2024年IPO失败,因为大客户G42占收入83%-97%,被CFIUS以国家安全为由卡了。
这次G42从股东名单消失,换成OpenAI。但问题还在:客户集中度没根本解决,只是大客户换了。投资者要判断:这个大客户更好吗?OpenAI信用比G42好,但它也在自研ASIC,一旦成熟,对Cerebras就是替代威胁。Cerebras也在拓展客户,招股书会列更多收入来源,但在OpenAI自研芯片量产前,这个风险没消除。
买它的股票,等于押注OpenAI会持续选Cerebras,且自研芯片不会提前来——这两条都不确定。当然,多头理由也存在:推理市场规模按预测增长,哪怕Cerebras占小份额,绝对数字也可观。问题是350亿估值是否已经反映了最乐观的情况?
英伟达的200亿是防御——用最贵的价格堵自己填不上的技术缺口;OpenAI的200亿是进攻——烧钱建不依赖英伟达的推理高速公路,还拿到收费站的认股权。
这场战争没有枪声,但资金流向从不说谎:AI推理基础设施的控制权,正在被激烈争夺,而这块市场2026年占全行业算力支出的2/3。Cerebras的IPO,就是这场战争的号角。
你觉得这场推理战争最后谁会赢?是英伟达守住江山,还是OpenAI带着Cerebras逆袭?或者会冒出新的黑马玩家?评论区聊聊你的看法!觉得这篇内容有价值的话,别忘了点赞收藏转发,让更多人看到AI圈的底层战争!