Workflow
Muon二阶优化器
icon
搜索文档
独家|上轮才过几周,Kimi开启新一轮融资!估值直冲48亿美元,机构正疯狂“抢配”月之暗面
搜狐财经· 2026-01-20 05:25
融资与估值动态 - 公司正在进行新一轮融资 距离上一轮融资公布仅数周时间 融资进程迅速 [2] - 本轮融资的投前估值已接近48亿美元 较数周前的投后估值43亿美元 单溢价高达5亿美元 估值在短期内大幅提升 [2] - 由于市场需求极度旺盛 此轮融资可能很快就会完成 [2] - 针对48亿美元估值的具体细节 公司官方目前尚未发表评论 [4] 资本环境与市场地位 - 在智谱与MiniMax近期于香港成功上市并引发破竹之势后 投资人正以前所未有的热情涌向公司 [2] - 在智谱和MiniMax上市并交出惊人的市值表现后 原本犹豫的一线机构正蜂拥而至 争抢公司融资额度 [2] - 公司被视为最后一家具备顶级竞争力的非上市独角兽 [2] - 随着OpenAI等美国AI服务在华限制持续 中国本土AI龙头正迎来空前的“主场红利” [4] - 公司是阵营中唯一保持独立节奏、未被二级市场波动的顶尖标的 [4] 公司战略与财务状况 - 创始人明确表示 公司目前并不急于推进IPO进程 [3] - 公司目前持有超过100亿人民币的充足现金储备 有资本在长跑中保持自己的节奏 而非受限于短期财报压力 [3] - 创始人认为 大模型竞赛远未进入下半场 目前的重点应放在下一代推理模型的研发与底层算力集群的扩容上 目标是实现智能上限的阶跃 [3] 核心技术优势 - 公司吸引巨量资金加码 不仅因为其在“长文本”和“复杂推理”领域的技术壁垒 更因为它是投资人眼中布局中国AI未来、对抗外部不确定性的核心资产 [2] - 在技术路径上 公司主张将「Token效率」作为核心主线 认为Scaling Law的本质是“将能源转化为智能” 在存量数据有限的现实下 必须力求用更少的数据换取更高的智能 [3] - 公司为此推出了两项关键技术:一是「Muon二阶优化器」 实现了两倍的Token效率提升 意味着达到同样的智能水平只需一半的数据量 [3] - 二是「Kimi Linear架构」 首次让线性注意力机制在长上下文任务中超越了全注意力模型 端到端速度提升了6到10倍 [3] - 对于Agent的推理本质 创始人认为是一个搜索过程 高Token效率的基础模型提供了强大的先验知识 而长上下文则构成了模型的工作记忆 [4] - 创始人认为开发模型是在创造一种世界观 每个模型产生的Token都是独一无二的 [4]
月之暗面迎来一名女总裁
华尔街见闻· 2025-12-09 21:01
公司核心动态:月之暗面(Kimi)的战略与商业化 - 前金沙江创投主管合伙人张予彤以“Kimi总裁”新身份公开亮相,负责公司整体战略与商业化,包括融资与新产品开发 [1][2] - 公司推出付费会员服务“OK Computer”模式,旨在让用户为节省时间和解决复杂问题的能力付费,打破国内大模型长期免费的传统,是从烧钱换量转向价值变现的关键举措 [6] - 公司最新一轮融资已接近收尾,估值有望冲至40亿美元,并有IPO计划 [6] - 面对用户增长瓶颈,公司收缩了投放预算,策略从“烧钱换量”转向依靠“技术溢价”路线 [4][6] 公司技术能力与市场地位 - 公司最新的开源思考模型Kimi K2 Thinking在HLE和BrowseComp等基准测试中刷新了SOTA记录,据称超越了GPT-5和Grok 4等顶尖模型 [4] - 公司技术底牌包括Muon二阶优化器,首次在万亿参数模型上验证了可行性,使Token效率提升了2倍 [4] - 全球顶尖AI搜索应用Perplexity在其模型列表中,除闭源模型外,唯一接入的就是Kimi K2 Thinking [4] - 公司强调即便只有海外巨头1%的资金和人员投入,依然能重写训练范式,以回应市场对其“后劲不足”的担忧 [3][4] - QuestMobile数据显示,Kimi月活用户数从去年底的2101万下滑至今年三季度末的967万,而同期豆包和DeepSeek月活破亿 [5] 行业竞争格局与趋势 - 中国AI市场呈现清晰的“双寡头”特征:字节跳动的豆包依靠抖音生态日活达5000万,深度求索(DeepSeek)以极致的技术效率和低价策略击穿行业底线,两者切走近半壁江山 [8] - 阿里千问、月之暗面、智谱AI、MiniMax等“六小虎”被夹在巨头生态霸权和DeepSeek的成本优势之间,单纯靠聊天机器人已不足以确立生存空间,进入差异化生存的淘汰赛 [8] - 行业从“百花齐放”固化为“阶层分化”,靠PPT融资的“草莽时代”已结束,下半场是关于获客成本、用户生命周期价值和毛利率的冷酷计算 [8][10] - 大模型公司资本化进程加速,智谱AI已在北京证监局备案辅导,MiniMax也传出IPO规划,给同行带来巨大心理压力 [9] 行业参与者战略调整 - “六小虎”开始痛苦变阵:百川智能重新聚焦医疗垂直领域,试图避开通用模型的竞争;零一万物放弃了万亿参数超大模型研发,转而拥抱DeepSeek模型做To B应用 [8] - 分析师认为大模型市场不会赢家通吃,而是分层共存,在政府、金融等强调安全可控的场景以及企业垂直领域仍有发展机会,关键看商业化落地路径 [9] - 随着基础大模型能力提升,垂直领域在未来1-2年里会有较好的变现机会 [9]