实时推理
搜索文档
AI芯片公司,拿下OpenAI百亿美元大单
半导体行业观察· 2026-01-15 09:38
交易核心信息 - OpenAI与Cerebras Systems达成一项价值超过100亿美元的协议,将在未来三年内购买高达750兆瓦的计算能力 [1] - 该产能将分批投入使用,直至2028年 [3] - Cerebras设计的AI芯片声称其运行AI模型和生成响应的速度比行业领导者英伟达更快 [1] 合作背景与战略动机 - OpenAI正加紧获取更多数据中心容量,为下一阶段增长做准备,公司每周用户超过9亿,并面临严重的计算资源短缺 [5] - OpenAI也在寻找比英伟达芯片更便宜、更高效的替代方案,此前已宣布与博通合作开发定制芯片,并签署协议使用AMD的新型MI450芯片 [5] - OpenAI的计算战略是构建弹性系统组合,将合适的系统与合适的工作负载相匹配,Cerebras为其平台增加了专用的低延迟推理解决方案 [2] - OpenAI基础设施主管表示,公司收入的最大预测指标是计算能力,过去两年计算能力与收入每年都增长了两倍 [6] Cerebras公司情况 - Cerebras正在洽谈以220亿美元的估值融资10亿美元,这将使其估值增长近三倍,此前已累计筹集18亿美元资金 [7] - Cerebras成立于大约十年前,在2024年提交上市申请时披露其大部分收入来自一家客户(G42),后撤回上市计划并通过私募融资11亿美元,估值为81亿美元 [8] - 该公司此后已与IBM和Meta签署了新的合作协议 [8] - Cerebras联合创始人兼首席执行官表示,与OpenAI合作是将世界领先的AI模型带到世界上速度最快的AI处理器上,实时推理将改变AI [2] 行业竞争与市场动态 - 专注于推理(运行训练好的AI模型生成响应)的芯片初创公司需求旺盛,AI公司竞相获取能提供快速、经济高效计算能力的尖端技术 [7] - 英伟达去年12月与Groq签署了一项价值200亿美元的授权协议,今年9月还与OpenAI签署了一项初步协议,拟向其出售价值高达10吉瓦的芯片,但该协议尚未最终敲定 [7] - OpenAI首席执行官Sam Altman是Cerebras的个人投资者,两家公司曾在2017年探讨过合作事宜 [1][8] OpenAI的财务状况与增长计划 - OpenAI去年营收约为130亿美元,仅占其与Oracle、微软和亚马逊签署的近6000亿美元新云合同的一小部分 [8] - OpenAI首席执行官表示,公司将通过未来的营收增长来支付这些分阶段履行的合同款项 [8] - OpenAI正处于新一轮大规模融资的早期阶段,以继续为其庞大的增长计划提供资金,预计在新投资前其估值可能达到8300亿美元 [9]
Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型
机器之心· 2025-09-20 12:37
技术方案与核心创新 - 提出Mini-Omni-Reasoner新范式,通过“Thinking-in-Speaking”实现边思考边表达,兼顾实时反馈与高质量推理 [4] - 采用Thinker-Talker架构,Thinker负责语音理解和逻辑推理,Talker专司语音生成,实现功能解耦 [12] - 设计2:8的回答-推理token交替比例,在保证推理深度的同时维持语音合成的流畅性,例如每秒生成50个token时可提供10个回答token [13] 实现机制与技术细节 - 模型在生成过程中同时维护回答流和推理流,循环输出p个回答token与q个推理token,实现token级别的思维与输出交替生成 [11] - 构建超过百万份高质量训练数据的Spoken-Math-Problems-3M数据集,并设计四阶段数据管线解决“逻辑错位”问题 [17] - 采用五阶段训练管线,包括对齐训练、混合数学预训练、文本thinking-in-speaking训练、语音thinking-in-speaking训练及Talker训练,确保稳定收敛 [19][22] 性能表现与实验结果 - 在Spoken-MQA数据集上测试,模型相比基座模型Qwen2.5-Omni-3B有明显性能提升 [21] - “Thinking-in-Speaking”方法能在保持回复内容自然简洁的情况下维持高质量的推理过程 [24] 行业意义与发展前景 - 该技术是对话模型迈向复杂问题解决的早期尝试,旨在释放大模型推理能力在对话系统中的应用潜力 [25] - 未来探索方向包括通用问题推理增益评测、模型自主决定思考时机以及突破固定比例生成以实现更灵活的思维范式 [26][28]