physical AI
搜索文档
从 Cerebras IPO 聊起:AI 算力变化、Scaling law 的萌芽和百度美研往事
晚点LatePost· 2026-06-23 18:11
Cerebras公司概况与核心创新 - 美国AI芯片与系统公司Cerebras于2024年5月中旬登陆纳斯达克,上市一个月内市值一度逼近千亿美元,目前市值约500亿美元[5] - 公司自2015年创立起便选择颠覆性路线:采用Wafer-Scale架构,将整片晶圆做成一个巨大的AI计算引擎,以大幅减少数据搬运和通信开销[5][8] - 公司不仅是一家芯片公司,更提供一套从芯片到系统(包括服务器、散热、电源、编译器和软件栈)的AI算力新方案[8] 市场定位与竞争格局 - 市场常将Cerebras视为“英伟达挑战者”,但其更准确的定位是英伟达在特定负载(尤其是推理)上的挑战者,而非全面替代[8][10] - 英伟达的护城河不仅在于H100、GB200等芯片,更在于CUDA、开发者生态、网络、软件、客户信任和供应链构成的完整体系[10] - Cerebras的机会在于AI推理场景,其架构在需要低延迟、高吞吐、受限于内存带宽和通信延迟的推理负载中具有明显优势[10] 技术优势与市场需求变化 - Cerebras的Wafer-Scale架构将约八十多个芯片级模块无缝集成在一片晶圆上,使计算单元、内存和通信网络同处一个硅片,从而加速计算[15] - 与需要将多个GPU通过NVLink等方式互联的传统方案相比,该架构显著减少了分布式通信和内存搬运[15] - 市场需求发生关键变化:两三年前AI算力主要用于模型训练,而当前一半以上的算力已用于推理,且AI Agent的爆发进一步拉动了推理算力需求,这使Cerebras的低延迟、高吞吐优势变得更有价值[10][11] 重要合作与业务拓展 - OpenAI与Cerebras签署了规模超过200亿美元的大额合作[11] - OpenAI创始人Sam Altman个人早在2016年就已投资Cerebras,很早就意识到不能只依赖英伟达[11] - 对OpenAI等前沿模型公司而言,算力是扩展模型的核心瓶颈,分散供应商、寻找第二方案是必然选择,Anthropic也在使用Google的TPU[12] - Cerebras推出Cerebras Cloud云服务,旨在通过API封装底层复杂系统,降低客户采用新硬件的门槛,这对扩大客户采用具有战略意义[12][13] - 公司与AWS(亚马逊云科技)合作,并与CoreWeave、Nebius等新云厂商存在合作机会,以应对当前普遍的算力短缺问题[13][14] 发展前景与风险挑战 - 公司发展上限很高,鉴于AI算力(尤其是推理)需求巨大,未来市值达到5000亿美元也不足为奇[14] - 主要风险或下限在于Wafer-Scale方案能否持续规模化,包括扩大客户范围、实现大规模交付、稳定运营并让客户真正用起来[14] - 当前客户仍比较集中,与更成熟的芯片厂商相比不够分散[14] - 规模化交付的难点包括进一步放量生产后的良率问题,尽管早期工程风险(如封装、散热、良率)已基本解决[15][16] - 公司战略重点明确:与其纠结于训练市场(客户已形成基于英伟达GPU的训练体系),不如专注于在推理市场扩张,这与其架构优势更匹配[31][32] 早期投资背景与决策过程 - 投资方百度美国研究院在2016-2017年已形成共识:AI进步需要更大的模型、更多的数据、更强的算力,而GPU并非专为深度学习设计[7][9][19] - 当时百度已在训练接近3亿参数的语言模型,使用GPU训练一次需三个多月,因此对能将训练效率提高千倍的架构有强烈需求[21] - 在评估了Graphcore、Wave Computing和Cerebras等公司后,最终选择了架构最颠覆、团队博士密度最高(约80人中近70位博士)且由连续创业者Andrew Feldman领导的Cerebras[22][23][24] - 投资决策基于深入的技术尽调,包括利用百度的PaddlePaddle框架在Cerebras模拟器上验证性能,并逐一拆解良率、散热、封装、编译器对接等风险[27][28] - 2017年百度投资Cerebras的C轮时,其估值已达7亿多美元,接近独角兽规模。当时预测2025年AI训练市场约220亿美元,并给予Cerebras 20%的市占率预期,但实际AI发展速度远超预期[30] 行业洞察与投资趋势 - 伟大的投资发生在共识形成之前,但当前AI已成为共识,“非共识”的投资窗口期变得极短,可能只有一两个月[7][45] - 头部VC集体意识到需要重注AI(而非SaaS)是在ChatGPT Moment之后,这导致投资策略演变,更多资金涌向已跑出圈的后期公司[7][37][46] - 当前重要的投资方向包括:推理成本优化(直接影响模型公司和应用公司的毛利)、部署优化、多模态推理优化等[44][45] - 未来值得关注的方向包括:Physical AI(物理人工智能),其对任务正确性的要求比自动驾驶更宽容,且可能带来新的低延迟、低功耗芯片需求[48][49] - 尽管早期投资窗口变短,但若将AI周期拉长看,行业仍处早期,已形成的赢家(如Anthropic、Fireworks AI、Together AI等)可能形成飞轮效应,变得更大[47]