Workflow
AWS Trainium2
icon
搜索文档
哈佛辍学生拿下5亿美元融资:不造GPU,也要“绕开”英伟达
是说芯语· 2026-01-16 07:37
公司概况与融资 - 由哈佛大学辍学生Gavin Uberti和Chris Zhu于2022年创立,总部位于美国加州圣何塞 [12] - 近期完成近5亿美元新一轮融资,由Stripes领投,Peter Thiel等参与,公司估值达50亿美元,总融资额接近10亿美元 [1] - 核心团队包括联合创始人兼CEO Gavin Uberti(前哈佛数学研究员与AI编译器专家)、联合创始人Chris Zhu(前哈佛数学与高性能计算研究员)、联合创始人兼总裁Robert Wachen(前创业孵化器联合创始人)以及CFO Mark Ross(前Cypress公司CTO)[12][14] 产品与技术策略 - 公司专注于开发为Transformer架构AI模型设计的专用定制芯片(ASIC),名为Sohu [3] - Sohu芯片采用台积电4nm工艺制造,并集成HBM内存和服务器硬件 [10] - 技术策略高度专业化,仅专注于运行Transformer模型,不做通用GPU,通过“做减法”避免运行其他AI模型(如CNN、LSTM)的硬件和软件开销,旨在实现极致效率 [10] - 产品定位为生产级推理芯片,目标是在密集模型、稀疏模态、扩散等场景下,将每美元及每瓦的计算效率提升1个数量级 [7] 性能与效率主张 - 在特定测试配置下,运行Llama 70B模型时,Sohu芯片可实现每秒处理超过50万个token的吞吐量 [3] - 公司宣称,在运行文本、图像和视频Transformer时,Sohu的速度比英伟达Blackwell GB200 GPU快1个数量级,且价格更低 [4] - 一台由8颗Sohu芯片组成的服务器,据称可以替代160块英伟达H100 GPU [5] - 公司早期研究显示,在运行生成式AI模型时,其方案每美元性能可达传统图形处理器的140倍 [14] 市场背景与机遇 - 行业背景是AI大模型训练成本超过10亿美元,推理应用规模可能超过100亿美元,在此规模下,1%的性能提升就足以支撑价值5000万至1亿美元的定制芯片项目 [5] - 市场判断认为,过去几年计算密度(TFLOPS/mm²)仅提升了约15%,且随着大模型训练放缓、推理需求暴涨,算力需求正从单纯比拼FLOPS转向综合比拼成本、延迟和能耗 [3] - 据预测,到2026年底,英伟达数据中心累计销售额将超过5000亿美元,显示了巨大的潜在市场空间 [3] 应用案例与长远愿景 - 公司与Decart合作推出AI生成游戏Oasis,该游戏画面由生成模型实时合成,据称模型在Sohu上的运行速度提升了10倍以上 [11] - 公司长远愿景不仅限于文本生成模型,还包括为图像、视频生成以及蛋白质折叠模拟等不同类型的AI模型制造其他芯片 [16] 行业竞争格局 - 多家公司正探索AI推理专用芯片,作为GPU的替代方案,例如Meta的MTIA、亚马逊的Graviton和Inferentia [10] - 其他初创公司如Perceive(推出Ergo 2处理器)、Groq(推出LPU)以及Tenstorrent(基于RISC-V架构开发AI处理器)也展示了类似的专用化思路 [17]
摩根士丹利:AI ASIC-协调 Trainium2 芯片的出货量
摩根· 2025-07-11 09:13
报告行业投资评级 - 行业评级为In-Line [8] 报告的核心观点 - 因投资者对AWS Trainium2/2.5芯片出货量假设存疑,进行后续研究,供应链检查显示Trainium2/2.5生命周期(2H24 - 1H26)预计出货190万单位 [2][11] - 归因AWS Trainium2/2.5芯片在半导体和系统间出货量不匹配问题,是PCB良率不稳定所致,预计2025年芯片出货量达110万单位 [1][8] - 随着Trainium2基板和机架组装良率提升,出货量差距可能在2025年下半年缩小 [6] 各部分总结 芯片出货量情况 - Trainium2/2.5生命周期(2H24 - 1H26)预计出货190万单位,2024年末已生产30万单位Trainium2芯片,2025年CoWoS - R总产能预订意味着Trainium2/2.5出货约110万单位,其中约70%由台积电封装,30%由日月光封装,预计2026年上半年再生产50万单位Trainium2.5芯片 [3][11] - 2026年Trainium2预计降至50万单位,Trainium3预计生产60 - 65万芯片,Trainium4预计2027年末小批量生产,2028年快速增长 [11][13][14] 不同环节视角 - 上游芯片产出方面,看到110万单位,与下游数据有差异 [11] - 中游PCB方面,下游分析师检查显示下游组件出货可能意味着超过180万单位Trainium芯片,自4月以来约每月20万单位,金居提供Trainium计算托盘的PCB板,King Slide提供导轨套件 [4] - 下游服务器机架系统方面,纬颖是服务器机架组装关键供应商,其AWS Trainium2服务器收入在2025年第一季度开始增长,基于每机架32颗芯片的服务器机架单位,芯片消耗量与上游的110万单位一致 [5] 其他组件供应商 - 热解决方案主要由AVC(>80%)供应,电源/BBU由光宝科技提供,King Slide是主导导轨套件供应商,Bizlink是AEC供应商,三星是Trainium2.5主要供应商,Trainium3会增加海力士和美光作为供应商 [10] 全球CoWoS需求 - 展示了2023 - 2026年各公司的CoWoS需求及占比情况,如英伟达、博通、AMD等,AWS + Alchip在2023 - 2026年的需求分别为9、16、5、40k wafers,占比分别为8%、4%、1%、5% [17] 全球HBM消费 - 2025年预计HBM消费高达160亿GB,展示了各AI芯片供应商产品的CoWoS容量分配、芯片出货量、HBM芯片密度、单位数量、总HBM需求等信息 [19][20] 相关公司项目情况 - AWS Trainium2的5nm设计服务由美满电子处理,Trainium3项目中,确信Alchip的3nm项目市场份额和生产时间,台积电的CoWoS产能分配将支持其发展,预计2026年初开始高产量生产,2026年Alchip预计营收15亿美元 [11][12][13] - 亚洲团队认为Alchip很可能继续赢得Trainium4的2nm项目,AWS可能很快做出早期决定,Trainium4预计2027年末小批量生产,2028年快速增长 [14] 行业覆盖公司评级 - 列出Greater China Technology Semiconductors行业覆盖公司的评级、价格等信息,如ACM Research Inc评级为O,价格为27.98美元;台积电评级为O,价格为1080新台币等 [79][81]