公司技术路线与战略 - 月之暗面创始人首次完整披露Kimi技术路线图,核心是推动大模型智能上限的持续突破,需对优化器、注意力机制及残差连接等底层基石进行重构 [1] - Kimi的进化逻辑归纳为三个维度的共振:Token效率、长上下文以及智能体集群,旨在计算效率、长程记忆和自动化协作上同时寻找规模效应 [3] - 公司针对2017年诞生的全注意力机制,展示了基于KDA架构的Kimi Linear,这是一种混合线性注意力架构,挑战了“所有层必须使用全注意力”的惯例 [3] - 针对已有十年历史的残差连接,Kimi引入了Attention Residuals方案,将传统的固定加法累加替换为对前序层输出的Softmax注意力 [4] - 在智能体集群方面,Kimi K2.5引入的Orchestrator机制能将复杂长任务拆解给数十个子Agent并行处理,并设计了新的并行RL奖励函数以防止“串行塌缩” [4] - 公司将继续坚持开源路径,将MuonClip、Kimi Linear和Attention Residuals等底层创新贡献给开源社区 [5] 公司融资与估值 - 月之暗面Kimi正以投前估值180亿美元(约合人民币1200亿元)进行新一轮10亿美元融资 [1] - 约一个月前,Kimi刚完成逾7亿美元的融资,当时估值为100亿美元 [1] - 在去年底一轮5亿美元的融资中,其估值为43亿美元 [1] 行业技术趋势与范式 - 在英伟达GTC 2026大会上,算力基建的规模化已成为行业共识 [3] - 行业目前普遍使用的很多技术标准本质上是八九年前的产物,正逐渐成为Scaling的瓶颈 [3] - AI研究范式正在转变,十年前的研究受限于算力难以验证想法,现在拥有足够资源和“缩放阶梯”可进行严谨的规模化实验,得出更可靠的结论 [5] 行业反响与评价 - Kimi在残差连接方面的工作引发了前OpenAI联合创始人Karpathy的思考,xAI创始人马斯克也评论称该项工作令人印象深刻 [4]
首次完整披露!月之暗面创始人英伟达大会重磅发声