算力蛋糕被切走一块,英伟达慌了?非芯片老手联手OpenAI另起炉灶

发布时间:2026-04-26 20:40  浏览量:1

2026年4月17日,Cerebras公司向美国证监会提交了上市申请,它的估值从81亿美元一下子涨到350亿美元,这变化不是靠卖货多,而是因为和OpenAI签了个大协议,未来两年里要给OpenAI建一个750兆瓦的算力设施,专门用来做推理任务,OpenAI还提前给了10亿美元开发费,外加百分之十的认股权,这已经不是普通买芯片的事了,更像是两家公司联手打造一个不依赖英伟达的基础平台。

OpenAI自己日子过得不容易,2025年赚了131亿,却亏掉80亿,2026年预计还要亏损250亿,像Sora视频模型每天光算力就要烧1500万美元,收入才210万,一段10秒视频成本33美元,根本没人愿意付这个价钱,奥尔特曼终于想通了,再这样依赖英伟达,等于把利润一直送出去,所以他一边找博通定制芯片,一边买AMD的MI450,打算把算力来源分散开。

Cerebras的做法很特别,他们不用一堆小芯片拼成GPU集群,而是直接在一块300毫米的晶圆上做一个超大芯片,叫做WSE-3,传统GPU靠堆叠芯片和用HBM内存,数据来回传输又慢又贵,Cerebras把内存和计算单元放在同一块晶圆上,延迟降低了90%,算一个token的成本减少了80%,最关键的是它不依赖HBM,而HBM长期被英伟达、三星和SK海力士控制着,今年3月他们已经和AWS谈妥,算力要进入亚马逊云,说明这不是实验室里的玩具。

不光美国公司在行动,中国这边也在跟进,DeepSeek V4训练时还在用英伟达芯片,但明确表示下半年会支持华为昇腾950,而且token价格要降不少,天数智芯和寒武纪也都在做类似的事情,另一边,谷歌推出了第八代TPU,Meta也公布了2027年推出四款自研芯片的计划,走的是自己研发加上外部采购的路子,黄仁勋自己也承认,对华禁售算力芯片这件事反而刺激中国建立起自己的闭环生态,特别是开源模型配上国产芯片,实际推进速度比预想的要快。

Cerebras的创始人Andrew Feldman不是学技术出身的,他在斯坦福读的是经济和MBA,2007年他创办了SeaMicro,想法很直接,就是觉得服务器里面太多零件用不上,把它们去掉,集中做横向扩展,结果2012年AMD花了3.55亿美元把公司买走,这次他又赌一把,别人说整块晶圆做芯片良率肯定低,他就是不信,他的思路不是和别人比谁晶体管多,而是重新设计整个系统怎么运行更顺畅。

现在的情况很清楚,英伟达的毛利率超过百分之七十五,靠的就是它在市场上的垄断地位,但摩尔定律早就走不动了,芯片性能提升变得越来越难,同时开源模型发展得越来越成熟,国产芯片也逐渐能够派上用场,大家开始各自搭建自己的技术路线,Cerebras走的那条不用HBM的路子,加上中国那边开源加国产的组合策略,正在一点一点地松动英伟达“芯片加软件加生态”三位一体的控制格局,这不是一夜之间就能翻盘的事,但风向确实已经变了。

有人把它当成技术路线上的分歧,我觉得这更像是关于选择权的讨论,过去大家没有别的办法,只能依赖英伟达的产品,现在就算性能稍弱一点,至少能自己做主了,成本也降得下来,算力这个东西,迟早会从"谁有谁说了算"变成"谁用得起谁有话语权"。

Cerebras这家公司不太爱搞营销宣传,他们直接把整块晶圆当成电路板来用,没想到最后还真把这个方案给跑通了。

OpenAI这么做不是突然变卦,是因为公司账本上的数字实在撑不住了。

这些事接连发生,看起来像是偶然,其实早有迹象。