推理芯片 - 财报，业绩电话会，研报，新闻

推理芯片

搜索文档

从 Cerebras IPO 聊起：AI 算力变化、Scaling law 的萌芽和百度美研往事

晚点LatePost· 2026-06-23 18:11

Cerebras公司概况与核心创新 - 美国AI芯片与系统公司Cerebras于2024年5月中旬登陆纳斯达克，上市一个月内市值一度逼近千亿美元，目前市值约500亿美元[5] - 公司自2015年创立起便选择颠覆性路线：采用Wafer-Scale架构，将整片晶圆做成一个巨大的AI计算引擎，以大幅减少数据搬运和通信开销[5][8] - 公司不仅是一家芯片公司，更提供一套从芯片到系统（包括服务器、散热、电源、编译器和软件栈）的AI算力新方案[8] 市场定位与竞争格局 - 市场常将Cerebras视为“英伟达挑战者”，但其更准确的定位是英伟达在特定负载（尤其是推理）上的挑战者，而非全面替代[8][10] - 英伟达的护城河不仅在于H100、GB200等芯片，更在于CUDA、开发者生态、网络、软件、客户信任和供应链构成的完整体系[10] - Cerebras的机会在于AI推理场景，其架构在需要低延迟、高吞吐、受限于内存带宽和通信延迟的推理负载中具有明显优势[10] 技术优势与市场需求变化 - Cerebras的Wafer-Scale架构将约八十多个芯片级模块无缝集成在一片晶圆上，使计算单元、内存和通信网络同处一个硅片，从而加速计算[15] - 与需要将多个GPU通过NVLink等方式互联的传统方案相比，该架构显著减少了分布式通信和内存搬运[15] - 市场需求发生关键变化：两三年前AI算力主要用于模型训练，而当前一半以上的算力已用于推理，且AI Agent的爆发进一步拉动了推理算力需求，这使Cerebras的低延迟、高吞吐优势变得更有价值[10][11] 重要合作与业务拓展 - OpenAI与Cerebras签署了规模超过200亿美元的大额合作[11] - OpenAI创始人Sam Altman个人早在2016年就已投资Cerebras，很早就意识到不能只依赖英伟达[11] - 对OpenAI等前沿模型公司而言，算力是扩展模型的核心瓶颈，分散供应商、寻找第二方案是必然选择，Anthropic也在使用Google的TPU[12] - Cerebras推出Cerebras Cloud云服务，旨在通过API封装底层复杂系统，降低客户采用新硬件的门槛，这对扩大客户采用具有战略意义[12][13] - 公司与AWS（亚马逊云科技）合作，并与CoreWeave、Nebius等新云厂商存在合作机会，以应对当前普遍的算力短缺问题[13][14] 发展前景与风险挑战 - 公司发展上限很高，鉴于AI算力（尤其是推理）需求巨大，未来市值达到5000亿美元也不足为奇[14] - 主要风险或下限在于Wafer-Scale方案能否持续规模化，包括扩大客户范围、实现大规模交付、稳定运营并让客户真正用起来[14] - 当前客户仍比较集中，与更成熟的芯片厂商相比不够分散[14] - 规模化交付的难点包括进一步放量生产后的良率问题，尽管早期工程风险（如封装、散热、良率）已基本解决[15][16] - 公司战略重点明确：与其纠结于训练市场（客户已形成基于英伟达GPU的训练体系），不如专注于在推理市场扩张，这与其架构优势更匹配[31][32] 早期投资背景与决策过程 - 投资方百度美国研究院在2016-2017年已形成共识：AI进步需要更大的模型、更多的数据、更强的算力，而GPU并非专为深度学习设计[7][9][19] - 当时百度已在训练接近3亿参数的语言模型，使用GPU训练一次需三个多月，因此对能将训练效率提高千倍的架构有强烈需求[21] - 在评估了Graphcore、Wave Computing和Cerebras等公司后，最终选择了架构最颠覆、团队博士密度最高（约80人中近70位博士）且由连续创业者Andrew Feldman领导的Cerebras[22][23][24] - 投资决策基于深入的技术尽调，包括利用百度的PaddlePaddle框架在Cerebras模拟器上验证性能，并逐一拆解良率、散热、封装、编译器对接等风险[27][28] - 2017年百度投资Cerebras的C轮时，其估值已达7亿多美元，接近独角兽规模。当时预测2025年AI训练市场约220亿美元，并给予Cerebras 20%的市占率预期，但实际AI发展速度远超预期[30] 行业洞察与投资趋势 - 伟大的投资发生在共识形成之前，但当前AI已成为共识，“非共识”的投资窗口期变得极短，可能只有一两个月[7][45] - 头部VC集体意识到需要重注AI（而非SaaS）是在ChatGPT Moment之后，这导致投资策略演变，更多资金涌向已跑出圈的后期公司[7][37][46] - 当前重要的投资方向包括：推理成本优化（直接影响模型公司和应用公司的毛利）、部署优化、多模态推理优化等[44][45] - 未来值得关注的方向包括：Physical AI（物理人工智能），其对任务正确性的要求比自动驾驶更宽容，且可能带来新的低延迟、低功耗芯片需求[48][49] - 尽管早期投资窗口变短，但若将AI周期拉长看，行业仍处早期，已形成的赢家（如Anthropic、Fireworks AI、Together AI等）可能形成飞轮效应，变得更大[47]