AI推理芯片
搜索文档
英伟达竞对公司完成8亿美元融资,台积电参投;OpenAI靠系统优化推理成本减半;特斯拉首辆量产无人驾驶出租车测试上路丨硅谷大事件
雷峰网· 2026-07-01 12:44
AI芯片与推理市场竞争格局 - AI芯片初创公司Etched完成8亿美元融资,投资者包括Jane Street和台积电关联风投 [4][5] - Etched专注于AI推理芯片设计,与英伟达形成直接竞争,其专用芯片在推理任务上可实现比英伟达通用GPU方案更高的能效和更低延迟 [4][5] - 公司已签署价值10亿美元的销售合同,若产品如期交付,可能推动AI芯片市场从“英伟达一家独大”走向“多方竞争”格局 [5][6] - AI推理市场正以每年超过50%的速度增长,市场碎片化为创业公司提供了窗口期 [5] 特斯拉自动驾驶与Robotaxi进展 - 特斯拉首辆量产版Cybercab在美国奥斯汀开始道路测试,这是该车型自2024年发布会后首次从展台进入实际道路 [8][10] - Cybercab采用无方向盘、无踏板设计,完全依赖FSD系统实现自动驾驶,标志着特斯拉全自动驾驶Robotaxi路线正从概念走向真实运营 [10][11] - 全球Robotaxi市场预计到2030年将达到万亿美元规模,若特斯拉能将单车成本控制在2.5万美元以内,将大幅降低Robotaxi运营门槛 [11] - Cybercab的量产节奏将是FSD估值逻辑兑现的关键验金石 [12] AI公司成本优化与技术创新 - OpenAI通过系统优化而非采购新芯片,将推理成本降低了一半以上,此次突破源于对现有服务器资源利用率的优化 [13] - 推理成本是AI公司商业模型的根本约束,成本降低可扩大利润空间并增加定价灵活性,OpenAI的持续压缩成本可能对整个行业产生示范效应 [13] - 高通正在推进一项基于近存计算架构的激进方案,将计算能力直接集成到DRAM内存中,旨在为AI推理提供比传统GPU更优的经济性,该技术计划于2026年推出 [15] - 有报道称,为降低运行成本,公司正让Claude和Codex等AI模型使用极简化的“原始人”级别语言交流,通过减少每次交互的token消耗来降低成本 [18] AI基础设施投资与资本运作 - 由KKR、英伟达等投资的新AI基础设施公司Helix Infrastructure Partners成立,由前AWS首席执行官Adam Selipsky领导 [13] - Helix的策略是快速收购已建成但未满负荷运行的数据中心资产,而非新建,此举可绕过新建数据中心所需的2-3年建设周期,直接投入运营以解决AI算力瓶颈 [13] - 全球数据中心等待时间预计将从2024年的3个月延长到2026年的12个月以上,Helix的模式正是针对这一供需失衡设计 [14] AI模型发布与市场策略 - Anthropic同日发布两个新模型:Claude Sonnet 5和Claude Science,显示AI模型发布频率正从“季度级”提速到“月度级” [14] - Claude Sonnet 5定价大幅低于此前发布的Mythos 5,每百万token分别为2美元或10美元,该价格区间定位中端市场,更适合开发者和中小企业日常使用,并支持1M上下文以处理长文档和复杂代码库 [14] - Claude Science模型旨在为科研自动化设计提供专属工作台 [14] AI领域的金融风险关注 - IMF货币与资本市场部主任Tobias Adrian表示,AI领域的债务发行量激增比股票估值更令人担忧,美国投资级公司债发行量预计2026年将增长25%,达到2.25万亿美元的历史新高 [16] - 大量资金通过债务融资而非股权融资涌入AI基础设施建设和数据中心,这种模式加大了金融系统的脆弱性,若行业出现预期落差,高杠杆企业将面临偿付压力 [16] - IMF此次侧重杠杆率层面,明确表示“债务比估值更值得担忧”,其表态赋予了多边机构的权威性警示 [17]
辛顿、李飞飞、台积电投资,英伟达谷歌大牛组队造芯,估值340亿
36氪· 2026-07-01 11:54
公司概况与融资 - AI芯片公司Etched通过4笔未披露融资筹集了8亿美元(约合人民币54.3亿元),最近一笔是2023年12月的5亿美元(约合人民币33.9亿元)融资,投后估值达50亿美元(约合人民币339.3亿元)[1] - 投资方阵容包括知名天使投资人辛顿、李飞飞、卡帕西、Peter Thiel,以及台积电旗下VentureTech Alliance、美国风投机构Jane Street等六家知名风投领投了最新一轮5亿美元融资[1] - 公司成立于2022年,总部位于美国加州圣何塞,三位联合创始人均为哈佛大学辍学生及蒂尔奖学金获得者,该奖学金提供每人10万美元资助鼓励辍学创业[2] 团队构成与背景 - 公司已组建一支超过400人的工程师团队,核心成员来自英伟达、谷歌TPU团队、博通、SK海力士、台积电等头部芯片和科技公司[3] - 团队核心成员拥有数十年芯片行业经验,包括曾是美国半导体公司Cypress(2020年被英飞凌以90亿欧元收购)CTO的Mark Ross(现任Etched CTO)[3] - 其他关键高管包括:在英伟达工作22年、曾负责HGX和DGX超算系统的Brian Loiler(现任平台业务副总裁);曾在英伟达H100/A100/V100团队担任架构师的Saptadeep Pal(现任ASIC与架构副总裁);曾打造谷歌TPU软件团队的David Munday(现任软件副总裁);曾领导初代iPhone、MacBook Air等产品生产与供应链的Wayne Cao(现任生产副总裁)[3] - 团队在芯片设计、系统架构和供应链管理方面积累深厚,支撑了从芯片到机架的垂直整合能力[4] 业务进展与产品 - 公司自研芯片已于今年早些时候完成首次流片,采用台积电N4P工艺(基于5nm技术平台)[1] - 目前正与客户一同验证首批机架级产品,订单需求达10亿美元(约合人民币67.9亿元),产品将在今年夏天发货并已启动生产[1] - 公司目标是打造全新的“前沿推理集群”,从晶体管到Token进行全栈协同设计,在吞吐量、延迟、成本和能效上达到一流水平[5] - 公司已在其圣何塞总部建成2MW数据中心、测试中心和NPI原型实验室,并在中国台湾设立工厂,将设计、验证和生产置于同一体系下,目标在2027年达到吉瓦级规模[6] 核心技术 - 针对AI推理芯片功耗、发热和带宽瓶颈,公司公布两项核心技术[5] - 第一项是低电压推理新型架构,使计算模块可在低于多数AI芯片一半的电压下运行,从而在不触发热节流的情况下,将万亿参数稀疏MoE模型的运行效率提升至峰值FLOPs的80%以上[5] - 第二项是创建了跨芯片的集群级内存共享池,通过专有的超低延迟高带宽互连实现更快的内存访问,其HBM/SRAM混合设计同时解决了内存容量和延迟问题,避免了纯SRAM芯片、3D DRAM或光学方案在成本、可靠性、良率等方面的权衡[5][6] 行业发展与市场环境 - 2023年公司向投资人推销AI需要专用推理芯片而非通用GPU的构想时几乎无人看好,所有接触过的主要投资机构都拒绝,公司一度濒临现金枯竭[2] - 2024年随着生成式AI爆发式增长,推理成为AI公司最大成本项和规模化瓶颈,投资者开始对能加速推理的芯片技术趋之若鹜,公司融资环境改变,当年筹集了超过1.25亿美元[2] - 随着大模型从实验室走向应用,推理正逐渐演变为AI算力消耗主战场,为推理任务专门研发AI芯片正变得更有性价比,亚马逊、谷歌、微软甚至OpenAI都在持续推进相关研发[7] - 市场对AI推理芯片头部玩家给予更多认可,例如Cerebras在2024年完成了纳斯达克IPO,Groq的技术通过授权协议进入英伟达体系[7]