Workflow
Sohu芯片
icon
搜索文档
哈佛辍学“三剑客”,做AI芯片,刚刚融了35亿
创业邦· 2026-01-24 12:10
公司概况与融资 - 人工智能芯片初创公司Etched.ai由三位哈佛辍学的00后创立,专注于开发专用于Transformer架构的ASIC芯片[3][4] - 公司于2022年正式成立,团队吸引了包括英特尔前副总裁、来自谷歌、微软、亚马逊等科技巨头的数十位专业人士加入[13] - 公司近期完成了5亿美元的A+轮融资,由Stripes Group领投,Ribbit Capital、Peter Thiel以及Palantir等跟投,此轮融资后公司估值接近50亿美元,总融资额接近10亿美元[4][19] - 此前融资历程包括:2023年种子轮融资536万美元,由Primary Venture Partners领投;2024年A轮融资1.2亿美元,由Positive Sum和Primary Venture Partners共同领投[19] 核心技术:Transformer专用ASIC - Etched.ai的核心产品是名为Sohu的ASIC芯片,该芯片专为运行Transformer架构的AI模型而设计,放弃了图形渲染单元和对CNN/RNN等传统模型的支持[16][18] - Sohu芯片采用台积电4nm工艺,其设计大幅简化,硬件利用率高达90%,而通用GPU平均仅为30%[16][18] - 在性能上,由8块Sohu芯片组成的服务器,其性能相当于160块英伟达H100 GPU,且功耗更低[18] - 公司宣称,在运行文本、图像和视频转换器时,Sohu的速度比英伟达的Blackwell GB200 GPU快一个数量级,价格也更低[18] 市场定位与竞争逻辑 - 公司认为Transformer架构将主导人工智能领域,其市场切入点是AI推理这一细分市场,旨在通过极致的垂直优化挑战英伟达[15][20] - 行业逻辑在于,随着AI模型架构趋向稳定,99%的算力都在运行同一种架构,专用ASIC芯片在性能和能耗上相比通用GPU具有显著优势[22] - 公司采用“All in or nothing”的业务模式,完全专注于Transformer架构,这意味着如果未来该架构不再流行,芯片价值将大打折扣,但投资人仍看好此模式[18] 行业趋势:专用芯片崛起 - AI硬件领域正涌现一批专注于专用芯片的挑战者,大致可分为三类:极致推理先锋(如Etched.ai、Groq)、巨型架构挑战者(如Cerebras Systems)以及专注于国产替代的国内ASIC劲旅(如寒武纪、后摩智能)[23][24][25][26] - 根据统计,多家AI ASIC创业公司已获得高估值,例如:Etched.ai估值50亿美元,Groq估值69亿美元,Cerebras估值220亿美元,d-Matrix估值20亿美元,Tenstorrent估值40亿美元,后摩智能估值超10亿美元[27] - 这些初创公司正试图通过极致的垂直优化,在效率与成本的竞赛中,于英伟达主导的市场开辟一片属于专用芯片的新森林[27]
哈佛辍学生拿下5亿美元融资:不造GPU,也要“绕开”英伟达
是说芯语· 2026-01-16 07:37
公司概况与融资 - 由哈佛大学辍学生Gavin Uberti和Chris Zhu于2022年创立,总部位于美国加州圣何塞 [12] - 近期完成近5亿美元新一轮融资,由Stripes领投,Peter Thiel等参与,公司估值达50亿美元,总融资额接近10亿美元 [1] - 核心团队包括联合创始人兼CEO Gavin Uberti(前哈佛数学研究员与AI编译器专家)、联合创始人Chris Zhu(前哈佛数学与高性能计算研究员)、联合创始人兼总裁Robert Wachen(前创业孵化器联合创始人)以及CFO Mark Ross(前Cypress公司CTO)[12][14] 产品与技术策略 - 公司专注于开发为Transformer架构AI模型设计的专用定制芯片(ASIC),名为Sohu [3] - Sohu芯片采用台积电4nm工艺制造,并集成HBM内存和服务器硬件 [10] - 技术策略高度专业化,仅专注于运行Transformer模型,不做通用GPU,通过“做减法”避免运行其他AI模型(如CNN、LSTM)的硬件和软件开销,旨在实现极致效率 [10] - 产品定位为生产级推理芯片,目标是在密集模型、稀疏模态、扩散等场景下,将每美元及每瓦的计算效率提升1个数量级 [7] 性能与效率主张 - 在特定测试配置下,运行Llama 70B模型时,Sohu芯片可实现每秒处理超过50万个token的吞吐量 [3] - 公司宣称,在运行文本、图像和视频Transformer时,Sohu的速度比英伟达Blackwell GB200 GPU快1个数量级,且价格更低 [4] - 一台由8颗Sohu芯片组成的服务器,据称可以替代160块英伟达H100 GPU [5] - 公司早期研究显示,在运行生成式AI模型时,其方案每美元性能可达传统图形处理器的140倍 [14] 市场背景与机遇 - 行业背景是AI大模型训练成本超过10亿美元,推理应用规模可能超过100亿美元,在此规模下,1%的性能提升就足以支撑价值5000万至1亿美元的定制芯片项目 [5] - 市场判断认为,过去几年计算密度(TFLOPS/mm²)仅提升了约15%,且随着大模型训练放缓、推理需求暴涨,算力需求正从单纯比拼FLOPS转向综合比拼成本、延迟和能耗 [3] - 据预测,到2026年底,英伟达数据中心累计销售额将超过5000亿美元,显示了巨大的潜在市场空间 [3] 应用案例与长远愿景 - 公司与Decart合作推出AI生成游戏Oasis,该游戏画面由生成模型实时合成,据称模型在Sohu上的运行速度提升了10倍以上 [11] - 公司长远愿景不仅限于文本生成模型,还包括为图像、视频生成以及蛋白质折叠模拟等不同类型的AI模型制造其他芯片 [16] 行业竞争格局 - 多家公司正探索AI推理专用芯片,作为GPU的替代方案,例如Meta的MTIA、亚马逊的Graviton和Inferentia [10] - 其他初创公司如Perceive(推出Ergo 2处理器)、Groq(推出LPU)以及Tenstorrent(基于RISC-V架构开发AI处理器)也展示了类似的专用化思路 [17]