实时推理 - 财报，业绩电话会，研报，新闻

实时推理

搜索文档

IPO早知道· 2026-03-18 13:15

AI产业重心转移 - 全球AI产业重心正从昂贵的“模型训练”阶段，全面迈入“实时推理”与规模化生产时代 [3] - Agentic AI（智能体AI）正推动推理工作负载呈指数级增长 [4] 联想与英伟达的战略合作与产品发布 - 英伟达CEO黄仁勋预测今年“将是联想集团的一年”，并高度评价其强劲的业务板块 [3] - 双方联合发布新一代“联想Hybrid AI Advantage™ (混合式AI优势集)”解决方案，旨在加速AI落地、缩短首token时间（TTFT）[3] - 联想集团成为英伟达NVIDIA Vera Rubin NVL72系统的全球首发合作伙伴 [4] - 与上一代相比，Vera Rubin系统吞吐量提升高达10倍，单token成本下降至前一代的1/10 [4] - 双方正通过新一代AI推理平台、AI云超级工厂及行业专用agentic AI解决方案，推进AI在全球范围内的真实生产交付 [5] 联想的技术与产品布局 - 新一代混合式AI解决方案覆盖从终端、数据中心到吉瓦级AI云部署，旨在赋能实时决策、提升运营效率和实现智能自动化 [4] - 推出下一代AI工作站ThinkStation PGX，作为专属AI Developer设备，能直接支撑最高2000亿参数的AI模型，并提供高达1 Petaflop的AI算力 [7] - 推出Lenovo AI Developer全栈AI开发套件与专业设计蓝图，以帮助开发者构建、扩展并保障AI工作流安全 [7] - 展示个人AI Hub概念机Project Kubit，该设备集成两台由NVIDIA GB10 Grace Blackwell超级芯片驱动的ThinkStation PGX AI工作站，可跨设备整合数据并运行AI应用 [7] 行业趋势与市场机遇 - AI的下一个拐点将显著推升对加速计算、软件和AI工厂的需求 [4] - Vera Rubin系统的发布标志着Agentic AI时代到来，并开启了史上规模最大的基础设施建设 [4] - 联想与英伟达携手提供支撑未来发展的全栈平台，通过结合NVIDIA AI Enterprise软件与联想全栈混合AI平台，帮助客户以更高效率、更低单token成本和更快投产速度扩展AI应用规模 [4]

联想Hybrid AI Advantage™ (混合式AI优势集)解决方案

Think Station PGX

Lenovo AI Developer全栈AI开发套件

人工智能

实时推理

人工智能

联想Hybrid AI Advantage™ (混合式AI优势集)解决方案

Think Station PGX

Lenovo AI Developer全栈AI开发套件

AI芯片公司，拿下OpenAI百亿美元大单

半导体行业观察· 2026-01-15 09:38

交易核心信息 - OpenAI与Cerebras Systems达成一项价值超过100亿美元的协议，将在未来三年内购买高达750兆瓦的计算能力 [1] - 该产能将分批投入使用，直至2028年 [3] - Cerebras设计的AI芯片声称其运行AI模型和生成响应的速度比行业领导者英伟达更快 [1] 合作背景与战略动机 - OpenAI正加紧获取更多数据中心容量，为下一阶段增长做准备，公司每周用户超过9亿，并面临严重的计算资源短缺 [5] - OpenAI也在寻找比英伟达芯片更便宜、更高效的替代方案，此前已宣布与博通合作开发定制芯片，并签署协议使用AMD的新型MI450芯片 [5] - OpenAI的计算战略是构建弹性系统组合，将合适的系统与合适的工作负载相匹配，Cerebras为其平台增加了专用的低延迟推理解决方案 [2] - OpenAI基础设施主管表示，公司收入的最大预测指标是计算能力，过去两年计算能力与收入每年都增长了两倍 [6] Cerebras公司情况 - Cerebras正在洽谈以220亿美元的估值融资10亿美元，这将使其估值增长近三倍，此前已累计筹集18亿美元资金 [7] - Cerebras成立于大约十年前，在2024年提交上市申请时披露其大部分收入来自一家客户（G42），后撤回上市计划并通过私募融资11亿美元，估值为81亿美元 [8] - 该公司此后已与IBM和Meta签署了新的合作协议 [8] - Cerebras联合创始人兼首席执行官表示，与OpenAI合作是将世界领先的AI模型带到世界上速度最快的AI处理器上，实时推理将改变AI [2] 行业竞争与市场动态 - 专注于推理（运行训练好的AI模型生成响应）的芯片初创公司需求旺盛，AI公司竞相获取能提供快速、经济高效计算能力的尖端技术 [7] - 英伟达去年12月与Groq签署了一项价值200亿美元的授权协议，今年9月还与OpenAI签署了一项初步协议，拟向其出售价值高达10吉瓦的芯片，但该协议尚未最终敲定 [7] - OpenAI首席执行官Sam Altman是Cerebras的个人投资者，两家公司曾在2017年探讨过合作事宜 [1][8] OpenAI的财务状况与增长计划 - OpenAI去年营收约为130亿美元，仅占其与Oracle、微软和亚马逊签署的近6000亿美元新云合同的一小部分 [8] - OpenAI首席执行官表示，公司将通过未来的营收增长来支付这些分阶段履行的合同款项 [8] - OpenAI正处于新一轮大规模融资的早期阶段，以继续为其庞大的增长计划提供资金，预计在新投资前其估值可能达到8300亿美元 [9]

Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型

机器之心· 2025-09-20 12:37

技术方案与核心创新 - 提出Mini-Omni-Reasoner新范式，通过“Thinking-in-Speaking”实现边思考边表达，兼顾实时反馈与高质量推理 [4] - 采用Thinker-Talker架构，Thinker负责语音理解和逻辑推理，Talker专司语音生成，实现功能解耦 [12] - 设计2:8的回答-推理token交替比例，在保证推理深度的同时维持语音合成的流畅性，例如每秒生成50个token时可提供10个回答token [13] 实现机制与技术细节 - 模型在生成过程中同时维护回答流和推理流，循环输出p个回答token与q个推理token，实现token级别的思维与输出交替生成 [11] - 构建超过百万份高质量训练数据的Spoken-Math-Problems-3M数据集，并设计四阶段数据管线解决“逻辑错位”问题 [17] - 采用五阶段训练管线，包括对齐训练、混合数学预训练、文本thinking-in-speaking训练、语音thinking-in-speaking训练及Talker训练，确保稳定收敛 [19][22] 性能表现与实验结果 - 在Spoken-MQA数据集上测试，模型相比基座模型Qwen2.5-Omni-3B有明显性能提升 [21] - “Thinking-in-Speaking”方法能在保持回复内容自然简洁的情况下维持高质量的推理过程 [24] 行业意义与发展前景 - 该技术是对话模型迈向复杂问题解决的早期尝试，旨在释放大模型推理能力在对话系统中的应用潜力 [25] - 未来探索方向包括通用问题推理增益评测、模型自主决定思考时机以及突破固定比例生成以实现更灵活的思维范式 [26][28]