K2 Thinking
搜索文档
中国明星AI公司,拿下5亿美元融资!90后创始人:当前持有现金超100亿元,“不着急上市”
每日经济新闻· 2025-12-31 22:52
每经记者|李宇彤 每经编辑|段炼 陈俊杰 大模型行业的生存竞赛,已悄然进入新阶段。 12月31日,《每日经济新闻》记者获悉,月之暗面(Moonshot AI)"90后"创始人杨植麟发布内部信,其透露:"公司近期完成了5亿美元C轮融资且大幅超 募,当前现金持有量超过100亿元。" 图片来源:视觉中国(资料图) 2025年底,行业正驶入快车道,上市潮起之际,月之暗面却明确表示不急于叩响资本市场大门。杨植麟在信中称:"相比于二级市场,我们判断还可以从 一级市场募集更大量资金。事实上,我们B/C轮融资金额就超过绝大部分IPO募资及上市公司的定向增发。所以我们短期不着急上市,也不以上市为目 的。" 就在2025年12月中旬,大模型独角兽智谱AI与MiniMax已相继通过港交所聆讯。两家企业近两日先后开始招股,预计分别于2026年1月8日、1月9日登陆香 港交易所。 对月之暗面旗下的Kimi来说,2025年是技术持续演进的一年。杨植麟在内部信开头即祝贺团队取得"SOTA成绩"(业界顶尖水准)。他写道,K2和K2 Thinking的发布标志着公司在AGI道路上走出重要一步,并列举了"中国首个万亿参数基座模型""第一个开源的 ...
Kimi完成35亿融资,海外收入大涨
第一财经· 2025-12-31 21:46
12 月 31 日,踩着 2025 年的尾巴,中国大模型初创公司月之暗面( Kimi )传来最新融资消息: 完成 5 亿美元 C 轮融资(约合 35 亿人民币),阿里、腾讯、王慧文等投资方均超额认购,投后估 值约 43 亿美元。 同在今日, Kimi 创始人、 CEO 杨植麟发布内部信,披露公司发展状况:技术层面, 2025 年是 Kimi 充满突破的一年, K2 和 K2 Thinking 的发布标志着公司在 AGl 道路上走出重要一步;商业 层面, Kimi C 端 9-11 月,海外和国内付费用户数平均 MoM (平均月度环比增长)增长超过 170% 。同时, K2 Thinking 的发布也显著带动了 API 收入的增加, 9-11 月海外 API 收入增长 4 倍。 杨植麟表示, 2026 年 Kimi 会成为一个"与众不同"和"不被定义"的 LLM (大语言模型)。不管 是别人没敢押注的技术无人区,还是需要一点偏执的审美坚持,相信有更多 Kimi-defined 的创新 能对人类文明加速发展产生独特贡献。这种独特性是 Kimi 存在的最大意义。 目标是超越前沿公司 Kimi 早期以"长文本处理" ...
Kimi完成5亿美元C轮融资,现金储备超百亿
搜狐财经· 2025-12-31 19:05
据《晚点 LatePost》,月之暗面(Kimi)近期完成 5 亿美元 C 轮融资,IDG 领投 1.5 亿美元,阿里、腾讯、王慧文等老股东超额认购,投后估值 43 亿美 元。 月之暗面创始人、CEO 杨植麟发布内部信表示,公司有超过 100 亿元人民币现金储备。这一规模已经不输于 IPO 之后的智谱、MiniMax。 具体来看,截至 2025 年 6 月,智谱有 25.5 亿元现金,IPO 预计融资约 38 亿。截至 2025 年 9 月,MiniMax 有 73.5 亿元现金,IPO 预计融资 34 亿-38 亿。 今年9月,Kimi正式发布Multi-Agent新品"OK Computer"并启动灰度测试,这一动作被业内视为其商业化进程的关键落子。"OK Computer"的核心能力在于让 AI自主完成复杂任务:用户只需下达指令,Kimi便可通过操作内置虚拟电脑,实现多功能网站开发、海量数据分析、图片视频生成及高品质PPT制作等操 作。 来源:猎云网 杨植麟在内部信中透露了公司的商业化情况:Kimi全球付费用户数月增速170%,受K2 Thinking大模型带动,Kimi在海外的大模型API收入增长4倍 ...
晚点独家丨Kimi 完成 5 亿美元新融资,杨植麟:账上有超百亿元人民币
晚点LatePost· 2025-12-31 16:04
IDG 领投,阿里、腾讯、王慧文等老股东超额认购,投后估值 43 亿美元。 文 丨 贺乾明 编辑 丨 程曼祺 《晚点 LatePost》独家获悉,月之暗面(Kimi)近期完成 5 亿美元 C 轮融资, IDG 领投 1.5 亿美元,阿里、腾讯、王慧文等老股东超额认购,投后估值 43 亿美元。 据了解,王慧文已经累计投资月之暗面 7000 万美元。 "他们前后只用了不到两个月,属于超额融资。" 一位接近月之暗面的人士称,一级市场对公司 的热情超出预期。 12 ⽉ 31 ⽇,⽉之暗⾯创始⼈、CEO 杨植麟发布内部信,公司有超过 100 亿元⼈⺠币现⾦储 备。 杨植麟在内部信中称,C 轮融资的资金将会用于更激进地扩增显卡,加速 K3 模型的训练和研发,并 公布了 2026 年的重要事项: 当前月之暗面有 300 人,他们会把部分新资金用于提高 2026 年的激励计划,预计是 2025 年的两倍, 并大幅上调期权回购额度。 这⼀规模已经不输于 IPO 之后的智谱、MiniMax: 今年 9 月,月之暗面推出 Agent 功能 OK Computer,可以调用虚拟电脑中的工具,开发网站、分析数 据、生成图片音频或制作 ...
AI大模型,别只盯着手机端MAU
创业邦· 2025-12-25 11:08
文章核心观点 - AI应用市场正经历路线之争,字节、阿里、腾讯等巨头沿用移动互联网的流量思维,追求DAU/MAU等规模指标,而模型公司Kimi则选择放弃流量竞争,将资源全部转向模型和产品能力本身,专注于成为高价值的生产力工具[6] - 评价AI应用的标准需要从移动互联网时代的“使用次数”转向“使用深度”,核心在于“智能”、“价值”和“不可替代性”,而非单纯的“热度”与“流量”[7][12][16] - Kimi通过三次关键选择——执着于技术深度、深度绑定专业用户、聚焦生产力工具链的稀缺生态位——构建了难以被流量和资本复制的竞争闭环,为AI创业公司提供了一条回归技术、场景与商业本质的差异化路径[18][19][20][22][23][24] AI行业路线之争:流量可乐 vs 价值精酿 - 字节、阿里、腾讯等巨头正将移动互联网的“流量”玩法平移到AI领域,依托庞大生态,沿着“泛娱乐、高日活”方向推进,追求“人手一瓶”的规模[6][9] - 模型公司Kimi选择了相反路径,放弃“大而全”的浅层生成(如图片、视频),将所有资源集中于构建“高价值的Agent任务”,旨在帮助用户完成需要数小时甚至数天的复杂工作[8][9][11] - 一位投资人用“可乐”与“精酿啤酒”比喻两种路线:“可乐”追求渠道和市占率,是规模狂欢;“精酿”更在意品鉴深度和核心客群,本质是量与质的区别[9] 评价体系变革:从旧尺子到新尺子 - 移动互联网时代的MAU指标已不适用于评价走向真实生产力场景的AI应用,用“旧尺子”量不出“新大陆”[6][13] - 更合适的“新尺子”应包含三个维度:第一,“深度”比“规模”更重要,例如Kimi Web端用户平均访问时长达8.5分钟,在国内AI产品中排名第一,表明用户在进行真实工作[6][14];第二,“智能”比“热度”更重要,体现在其处理长文本、复杂Agent任务的不可替代性,因此获得Perplexity等海外顶尖公司的接入[16];第三,“价值”比“流量”更重要,健康的商业模式应从“流量→广告→变现”转向“价值→订阅→变现”[16] - 决定商业模式未来的关键指标不再是MAU,而是ARPU(单用户平均收入)和LTV(生命周期总价值)[17] Kimi的战略选择与护城河构建 - **选择一:执着于技术深度**。在行业共识认为“不需要那么多基座模型”的背景下,Kimi仍坚持投入基础模型研发,以确保上层Agent应用的定价权和工作流稳定性,其K2模型的开源策略旨在倒逼自身技术进步[19] - **选择二:深度绑定“专业用户”**。放弃流量竞争后,Kimi聚集起付费意愿强、需求明确的专业用户,并使其转变为“Agent原生用户”,深度融入工作流,例如某券商研究员已将整个研究流程“外包”给Kimi,迁移成本极高[20][22] - **选择三:聚焦“打得赢”的战场**。Kimi不在C端聊天场景血拼,而是将技术聚焦于代码开发、学术研究、金融分析等生产力工具链,占据壁垒较高的稀缺生态位,例如通过提供与Claude Code完全兼容的API及“上下文缓存”功能,精准承接了外溢的开发者群体[22] - 这三个选择环环相扣,形成了“用户用得越深越离不开,付费支撑技术升级,技术升级吸引更多懂行用户”的飞轮效应,构建了单靠流量和资本难以复制的闭环[22][23] 市场表现与数据验证 - 2025年11月,Kimi旗舰模型K2 Thinking发布后,网站访问量环比上涨了48.6%[6] - 同期,Kimi的Web端用户平均访问时长达8.5分钟,国内AI产品中排名第一,反映了极强的用户粘性与使用深度[6][14] - 用户结构对比鲜明:作为生产力工具的ChatGPT,其Web端与App端用户比例约为60%:40%;而主打轻娱乐的豆包,该比例约为5%:95%,凸显了二者服务场景与用户群体的根本不同[13] - Social Capital的CEO提到,其投资的公司已将大量工作转到K2上,因为性能强且成本比顶尖闭源模型低得多[16]
MiniMax 和月之暗面:中国 AI 创业公司的两种路径和共同难题
晚点LatePost· 2025-11-24 19:11
核心观点 - 一时的技术成果或用户增长难以成为AI公司的持久竞争优势 公司需要建立能持续产生技术和用户增长的组织能力[5] - 在资本密集、巨头林立的竞争环境中 创业公司需要证明其长期独立存在的价值 这需要技术突破和维持高密度研究团队的罕见能力[26] 公司发展历程与融资 - 月之暗面起步融资遇挫 后在红杉、真格等机构投资下于2023年上半年完成首笔融资[11] 2023年底再融资时获阿里投资近8亿美元 估值达23.4亿美元[13] - MiniMax首轮融资由高瓴领投2000万美元 投后估值2亿美元[8] 同期获阿里投资6亿美元资源 估值超过月之暗面[13] - 两家公司2024年初融资合计超14亿美元(约100亿元人民币) 超过中国大模型创投领域上一年公开融资总额[13] 产品与技术突破 - MiniMax早期产品Glow上线4个月注册用户超500万[12] 近期开源模型M2在部分测评中位列全球开源模型第一[4] 其视频生成模型宣称在一些场景超过Google的Veo3[4] - 月之暗面产品Kimi上线后连续数月月活用户环比增长超100%[12] 近期发布的开源MoE模型K2宣称部分基准测试得分超过GPT-5[4] 其K2 Thinking模型在自主编程等维度超过DeepSeek-V3和阿里Qwen3[20] 创始人风格与管理策略 - 闫俊杰崇尚系统理性 将公司视为可优化函数 管理核心是找到梯度下降最快方向[23] 敢于决断并接受冲突 创业初期即叫停与长期技术路线不符的3D数字人项目[21] - 杨植麟相信人才力量 公司核心产品Kimi以其英文名命名[5] 看重共识驱动 愿为招揽技术人才从北京飞深圳聊十小时[23] 倾向于先达成共识再迅速行动[24] 竞争环境与挑战 - 字节跳动发动饱和式进攻 产品线覆盖全面 并严格控制外部AI产品在抖音投放[19] 豆包等字节系产品享受投放折扣[19] - 两家公司估值约40亿美元 远低于OpenAI的5000亿美元、xAI和Anthropic的近2000亿美元估值[25] 面临巨头阿里、字节、腾讯等拥有主营业务供血的竞争[25] - 早期增长吸引大额投资后 MiniMax陷入多条产品线并进的纠结 月之暗面视频模型效果未达预期 出海产品Ohai和Noisee停止运营[15]
K2 Thinking再炸场,杨植麟凌晨回答了21个问题
36氪· 2025-11-12 21:35
文章核心观点 - 月之暗面发布万亿参数开源模型K2 Thinking,在推理和任务执行等前沿能力基准测试中表现优异,甚至在某些榜单上超过GPT-5 [15] - 公司采取专注Agentic能力的策略,通过长思维链和高效工具调用设计,旨在让AI真正完成复杂任务而非仅用于聊天 [21][22] - 在芯片等基础设施受限的背景下,国产大模型通过算法创新加速发展,各厂商根据自身商业目标选择不同的技术路线,形成差异化竞争格局 [29][31][32] K2 Thinking模型技术特点 - 模型为1万亿参数的稀疏混合专家架构,实际运行时激活参数控制在300亿,平衡了性能与速度 [14][21] - 采用INT4量化手段,百万token输出价格仅为2.5美元,是GPT-5价格的四分之一,具备显著成本优势 [16] - 核心长板为长程执行能力,可连续执行200-300次工具调用来解决复杂问题,保证任务连续性 [22][56] - 通过端到端智能体强化学习训练,实现了交错“思考-工具”模式的稳定运行,这是大语言模型中相对较新的挑战 [56][57] 模型性能与市场定位 - 在高难度测试集HLE和BrowseComp等Agent榜单上,分数超过了GPT-5 [15] - 市场定位为GPT-5和Claude Sonnet 4.5的“平替”,专注于将文本模型能力做到极致,探索智能上限 [16][32] - 团队选择性能优先的策略,暂时不太考虑Token消耗效率,以确保Agent更可用 [21][32] 训练成本与硬件配置 - 团队澄清460万美元训练成本“不是官方数字”,强调主要成本在于研究和实验,难以量化 [8][34] - 训练在配备Infiniband的H800 GPU上进行,虽在GPU数量上处于劣势,但将每张显卡性能压榨到极致 [29][37] 技术路线与行业趋势 - 国产大模型在算法创新上加快进程,月之暗面、智谱、MiniMax等厂商接力开源,在全球榜单上表现亮眼 [17][29] - 面对长上下文处理问题,各厂商选择不同路径:MiniMax M2回退到全注意力机制求稳定;月之暗面则采用更激进的KDA+MLA混合架构 [31] - 中国开源模型的应用生态正在形成优势,吸引海外开发者构建应用并提供反馈,预计将带来更多应用爆发 [33] 未来发展规划 - 下一代K3模型计划引入重大架构更改,KDA实验架构的相关想法很可能被采用 [62] - 公司重心仍在模型训练,暂无计划推出AI浏览器类产品,认为做好模型无需再做浏览器“壳” [63][64] - 公司拥抱开源策略,相信AGI应是导致团结的追求,并考虑开源安全对齐技术栈以惠及社区 [65][66] - 未来会重新审视更长的上下文窗口,并可能发布更多如Kimi Linear的小模型作为研究演示 [44][45][46]
K2 Thinking再炸场,杨植麟凌晨回答了21个问题
36氪· 2025-11-11 18:30
公司战略与沟通 - 公司采用低调的社区发布模式,不开设线下正式发布会,选择在Reddit、知乎等开发者社区进行线上AMA互动[1][2] - 公司明确开源策略,拥抱开源社区,并考虑未来发布安全对齐技术栈以惠及更多开发者[43][44] - 公司专注于将文本模型能力做到极致,探索智能上限,当前重心在模型训练而非开发浏览器等应用外壳[21][41][42] 产品K2 Thinking核心能力 - K2 Thinking是1万亿参数的稀疏混合专家架构开源模型,在实际运行时激活参数控制在300亿以保证速度[7][12] - 模型在HLE、BrowseComp等代表前沿能力的Agent基准测试中表现优异,分数甚至超过GPT-5[8] - 模型专为Agentic能力设计,擅长长思维链,能够连续执行200-300次工具调用来解决复杂问题[12][13][35] 产品定价与技术细节 - K2 Thinking具有显著成本优势,其百万token输出价格为2.5美元,仅为GPT-5(10美元)的四分之一[8] - 模型采用INT4量化手段以提升推理速度并更好地兼容非Blackwell架构的GPU[8][38][39] - 模型训练在配备Infiniband的H800 GPU上完成,团队在GPU数量不占优的情况下将单卡性能压榨到极致[18] 行业竞争格局 - 国产大模型进入丰收季,智谱GLM-4.6、MiniMax M2及K2 Thinking接力开源,在全球榜单上表现活跃[9] - 国内厂商技术路线出现分化,MiniMax侧重性价比与稳定性,智谱GLM定位全面以抢占Claude断供后的市场,而公司则选择性能优先的激进路径[19][20][22] - 国产模型创新速度加快,在芯片等基础设施受限的情况下,于算法层面找到了细分创新方向[18][19] 未来发展规划 - 下一代K3模型计划引入重大架构更改,公司最新的KDA实验架构相关想法很可能会在K3中使用[40] - 公司未来会重新审视更长的上下文窗口,并可能发布更多像Kimi Linear这样的小模型作为研究演示[29][30] - 公司对多模态(如视觉理解)模型持开放态度,但因数据获取和训练需要时间,发布时间线会靠后[17]
资源不到万亿 OpenAI 的 1% ,Kimi 新模型超越 GPT-5
Founder Park· 2025-11-07 20:00
产品发布与核心能力 - 公司推出开源模型K2 Thinking,是其迄今为止最强的开源思考模型[2] - 模型采用1T参数、MoE架构、32B激活参数、原生INT4量化,并支持256k上下文长度,更好支持国产GPU[3] - 在“人类最后的考试”基准测试中取得44.9%的SOTA成绩,表现超过同类型闭源模型[10] - 模型无需人工干预,可自主实现高达300轮的工具调用和多轮思考能力,解决更复杂问题[6] 技术路径与架构演进 - 从K2到K2 Thinking,技术路径从“模型即Agent”演进到“模型即Thinking Agent”[6] - 模型支持多步工具调用,需将思考内容返回模型进行多次推理以保持连贯性,此能力与Claude的“扩展思考”类似,但OpenAI的GPT系列和Google的Gemini模型尚未支持[21][22][23] - 公司选择先做“交互”再做“反思”的技术范式,重点是多轮工具使用和测试时扩展[16][17][18] - 此技术进展被视为实现AI L3级别的重要突破[20] 行业竞争与资源对比 - 公司估值约为33亿美元,而OpenAI估值为5000亿美元,Anthropic估值为1830亿美元,Grok估值为2000亿美元[28][26] - 公司员工约200人,训练成本约460万美元,而xAI拥有20万块H100 GPU集群,员工超1200人,Grok 4训练成本可能达4900万美元[28][29] - 中国基础模型公司面临资源稀缺挑战,但公司用不到1%的资源实现了对国际巨头的技术超越[29] - 在HLE测试集上,旗舰模型成绩从最初不到20%提升至目前超过40%,显示模型能力持续进步[13]