Kimi%20K2%20Thinking
搜索文档
2025最后一天,Kimi杨植麟发内部信:我们手里还有100亿现金
36氪· 2025-12-31 20:38
12月31日,接近月之暗面人士透露,月之暗面(Kimi)创始人、CEO 杨植麟发布内部信,表示"当前现金持有量超过100亿元,不急于上市"。此 外,月之暗面(Kimi)近期完成5亿美元C轮融资,IDG领投1.5亿美元,阿里、王慧文等老股东超额认购,投后估值 43 亿美元。 针对以上消息,腾讯科技向月之暗面寻求证实,官方表示对此消息不予置评。 2025年,月之暗面在9月和11月相继推出了基座模型Kimi K2以及对标强化学习推理路径的Kimi K2 Thinking系列。相比2024年侧重于长文本 (Long Context)的单点突破,2025年的模型迭代重点转向了"思考过程的可解释性"与"复杂逻辑推理"。 Kimi于2025年10月正式推行大规模付费协议,包括针对普通用户的会员订阅和针对开发者的API阶梯计费。 杨植麟在内部信中也指出,"月之暗面9-11月付费用户月增速170%"。假设2025年初付费用户数为10万,按照这样的环比增速,年末则可达约170 万,若按人均月付费50元计算,单月营收约8500万元;若加上API收入(增长4倍),则单月营收有可能接近1亿元。此数据仅为估算,Kimi官方 并未公布营收 ...
Kimi账上100亿,杨植麟:我们不着急上市
搜狐财经· 2025-12-31 20:03
2025年最后一天,依然令人震撼。 投资界获悉,月之暗面(Kimi)已完成5亿美元C轮融资,且大幅超募阿里、腾讯、王慧文等老股东均追加投资。 本轮融资后,月之暗面投后估值跃升至43亿美元(约合人民币300亿元)。 今天(12月31日),月之暗面创始人、CEO杨植麟在内部信中透露,当前现金储备已超过100亿元。这一资金规模,几乎是即将IPO的智谱与MiniMax的 两家之和。 Kimi创纪录 刚刚融资5亿美元 印象中,这是月之暗面罕见的一次融资官宣。 此外,杨植麟也在内部信公布了2026年战略布局: 1.K3模型通过技术改进和进一步scaling,提升等效FLOPs至少一个数量级,在预训练水平上追平世界前沿模型; 2.垂直整合模型训练和agent产品taste。让K3成为更"与众不同"的模型,让用户体验到全新的,其他模型没有定义过的能力; 3.产品和商业化上聚焦agent,不以绝对用户数量为目标,持续追求智能上限,创造更大的生产力价值,营收规模实现数量级增长; 当中,C轮融资部分资金也将用于2026年的激励计划和期权回购计划。这个团队目标浮现超越Anthropic等前沿公司,成为世界领先的AGI公司。 在此之前 ...
Kimi账上100亿,杨植麟:我们不着急上市
投资界· 2025-12-31 18:47
月之暗面融资不靠IPO。 作者/周佳丽 吴琼 Kimi创纪录 刚刚融资5亿美元 印象中,这是月之暗面罕见的一次融资官宣。 在此之前,创投圈见证了月之暗面的融资速度,身后集结红杉中国、真格基金、Mo n o l i t h砺思资本、今日资本等知名基金以及阿里、 美团、小红书等大厂,估值也是螺旋式上升,早已挺进3 0亿美元大关。 今天,杨植麟在内部信中确认:公司近期完成了5亿美元C轮融资。投资界了解到,此次C轮融资中,阿里、腾讯、王慧文等老股东均 超额认购,投后估值达4 3亿美元(约合人民币3 0 0亿元)。 报道/投资界PEdaily 2 0 2 5年最后一天,依然令人震撼。 投资界获悉,月之暗面(Kimi)已完成5亿美元C轮融资,且大幅超募——阿里、腾讯、王慧文等老股东均追加投资。 本轮融资后,月之暗面投后估值跃升至4 3亿美元(约合人民币3 0 0亿元)。 今 天 ( 1 2 月 3 1 日 ) , 月 之 暗 面 创 始 人 、 CEO 杨 植 麟 在 内 部 信 中 透 露 , 当 前 现 金 储 备 已 超 过 1 0 0 亿 元 。 这 一 资 金 规 模 , 几 乎 是 即 将 IPO的智谱与Mi ...
视远 · 正心明智——「AI 中国」机器之心2025年度评选正式揭晓
机器之心· 2025-12-31 12:09
2025年人工智能行业技术发展态势 - 大模型技术演进速度被不断推高,新的模型架构、训练范式与推理策略轮番登场,技术边界持续向前推移 [3] - 海外新一代模型如GPT-5、Gemini 3相继亮相,在理解、生成与推理等核心能力上持续抬升上限,通用智能轮廓愈发清晰 [4] - 国内AI场面同样热闹,国产大模型在核心能力上不断拉近与国际头部模型的差距,并在个别方向上实现反超 [4] - 国内大模型在开源、工程化和应用适配方面明显提速 [4] - 决定行业长远价值的关键在于能力是否能在真实世界中持续发挥作用,并重塑生产方式、沉淀为基础能力,而非短期参数或榜单表现 [4] 2025年度“AI中国”评选榜单概览 - 机器之心策划了2025年度“AI中国”榜单,旨在记录中国人工智能进展并勾勒技术创新未来 [6] - 榜单评选于2025年正式揭晓 [7] 最强技术实力企业/机构TOP 10 - 该榜单评选出在技术实力方面领先的十家企业或机构 [7] 人工智能领军企业TOP 20 - 该榜单评选出二十家在人工智能领域处于领军地位的企业 [11][13] - 上榜企业包括DataCanvas、格灵深瞳、爱诗科技、昆仑万维、阶跃星辰、Meshy.ai、MiniMax、商汤科技、潞晨科技、生数科技、稀宇科技、无问芯穹、思谋科技、小红书、星辰天合、月之暗面Kimi、智谱、中兴通讯、中关村科金、中移九天、智象未来、HiDream.ai等 [14] 最佳大模型TOP 20 - 该榜单评选出二十个最佳大模型 [16] - 上榜模型包括阶跃星辰、讯飞星火、KAT-Coder-Pro V1、可灵AI、快手Mureka V7.6、Ling-1T、昆仑万维LongCat、蚂蚁集团LongCat-Flash-Chat、Intern-S1、上海人工智能实验室M LongCat、美团、商汤日日新SenseNova V6.5、生数科技Vidu、深度求索Deepseek 3.2、腾讯混元3.0、月之暗面Kimi K2 Thinking、智谱GLM-4.6等 [18] 最佳大模型产品TOP 20 - 该榜单评选出二十个最佳大模型产品 [20] - 上榜产品包括百度文心一言、阿里巴巴通义千问、百度慧播星、百度秒哒、钉钉AI、讯飞智文、京东言犀AI助手、昆仑万维Skywork Super、快手可灵AI Agents、蚂蚁集团灵光APP、蚂蚁阿福、腾讯云智能体开发平台、腾讯Argus、如视LARGUS等 [21] 具身智能领军企业TOP 20 - 该榜单评选出二十家在具身智能领域处于领军地位的企业 [23] - 上榜企业包括HUMANDOID、Dexmal、光轮智能、北京人形机器人创新中心、原力灵机、跨维智能、加速进化、魔法原子、弯彻智能、鹿明机器人、RoboScience、千寻智能、星尘智能、松延动力、星动纪元、星海图、银河通用、优必选、宇树科技、智元机器人、逐际动力、自变量机器人等 [24]
大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新
量子位· 2025-12-27 15:08
henry 发自 凹非寺 量子位 | 公众号 QbitAI "阶跃星辰怎么静悄悄…" 这就是年底国产大模型轮番冲刺热议一线时,阶跃星辰面临的外部评价。 Kimi靠K2重新获得证明,摆脱DeepSeek冲击波逆境; DeepSeek靠OCR、金牌数学模型热传热议,让人更加期待后面的大招; 智谱和MiniMax一手新SOTA模型交卷,一手提起IPO进程…… 而依然留在自研大模型牌桌上的"六小龙"选手阶跃星辰,甚至相比之前的"卷王"本王,都神秘安静得多。 直到刚刚,用最新的图像模型 NextStep-1.1 ,扳回一球。 其通过扩展训练和基于流的强化学习(RL)后训练范式,大幅提升了图像质量。 NextStep-1.1 总体来看,这次开源的NextStep-1.1解决了之前NextStep-1中出现的可视化失败(visualization failures )问题。 相较之前发布的NextStep-1,NextStep-1.1的更新主要有两方面: RL增强视觉保真度 : 通过RL显著改进了图像纹理,并大幅减少了视觉伪影(Visual Artifacts),确保输出更加清晰和专业。 技术稳定性 : 解决了自回归流匹配 ...
OpenAI前CTO再创业,新产品接入Kimi K2 Thinking;谷歌NotebookLM集成至Gemini丨AIGC日报
创业邦· 2025-12-16 08:07
商汤科技与寒武纪的软硬件协同 - 商汤科技发布行业首个多剧集生成智能体Seko2.0,其背后依托自研的日日新Seko系列模型 [2] - 日日新Seko系列模型已完成对国产AI芯片公司寒武纪的适配,双方于今年10月达成战略合作,重点推进软硬件联合优化 [2] - 双方后续将在模型核心能力、算力利用率与成本效率、大规模并行处理能力、资源管理机制等多个方向展开深度优化 [2] OpenAI前高管创业及大模型进展 - 前OpenAI首席技术官Mira Murati离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达500亿美元 [2] - 该公司首款产品Tinker已正式全面开放,并新增接入万亿参数级推理模型Kimi K2 Thinking [2] - Kimi K2 Thinking被描述为专为长时长推理和工具调用设计的"怪物级"模型,也是Tinker产品线中最大的模型 [2] 边缘计算硬件产品发展 - 在人工智能与边缘计算深度融合的背景下,本地化智能需求正重塑产业格局 [2] - 米尔电子推出RK3576边缘计算盒,具备高算力、低功耗与强扩展性 [2] - 该产品凭借其硬件架构与多场景适配能力,正成为推动工业视觉、工程机械及智慧城市等领域智能化升级的工具 [2] 谷歌AI产品功能集成 - 谷歌正将其强大的AI工具NotebookLM直接集成到Gemini中,以简化用户使用途径 [2] - NotebookLM现已在Gemini中上线,允许用户附加笔记本来为其与AI聊天机器人的对话提供额外上下文 [2]
Thinking Machines首款产品重大更新:K2 Thinking、Qwen3-VL都可以微调了
机器之心· 2025-12-15 18:00
Thinking Machines Lab及其产品Tinker的更新 - 由前OpenAI CTO Mira Murati创办的Thinking Machines Lab,其首款产品Tinker API已正式取消候选名单,向所有用户开放[1] - Tinker API旨在简化大型语言模型的后训练过程,开发者只需专注于训练数据和算法,而将调度、调优、资源管理和基础设施可靠性等复杂工作交由Tinker处理[1] - 此次更新包含三项主要功能增强:支持对万亿参数规模的Kimi K2 Thinking模型进行微调;提供兼容OpenAI API的全新推理接口,实现即插即用;新增支持视觉输入的两款Qwen3-VL模型[1] Tinker产品的核心价值与能力 - Tinker通过将训练基础设施抽象为API,使开发者无需自行采购GPU、搭建集群或维护分布式训练,显著降低了使用前沿大模型的门槛和成本[4] - 该平台首次让普通开发者能够微调万亿参数的Kimi K2 Thinking模型,这曾是顶级实验室的专属能力[4] - 新增的视觉模型支持(Qwen3-VL-30B-A3B-Instruct和Qwen3-VL-235B-A22B-Instruct)进一步降低了视觉语言模型的应用门槛,支持处理图片、截图及示意图等内容[1][4] 视觉能力展示与性能评估 - 为展示视觉能力,研究团队对Qwen3-VL-235B-A22B-Instruct模型进行了微调,并在Caltech-101、Stanford Cars、Oxford Flowers、Oxford Pets四个经典图像分类数据集上进行评估[4] - 研究将图像分类任务建模为文本生成问题,即给定图片,模型直接输出类别名称,并与传统的视觉基线方案DINOv2进行对比[4] - 在小样本数据场景下,经过微调的Qwen3-VL-235B-A22B模型表现优于DINOv2,这得益于其庞大的模型规模以及作为视觉语言模型所具备的通用语言与视觉联合知识[7]
全球语境下的中国 AI- 一场全球 “实力” 博弈-China AI in a Global Context — A Global ‘Power‘ Struggle
2025-12-15 09:55
全球人工智能行业研究纪要:中美“算力”之争 涉及的行业与公司 * **行业**:全球人工智能(AI)行业,特别是大型语言模型(LLM)、AI数据中心(AIDC)基础设施、AI智能手机应用生态 * **涉及公司**: * **美国**:谷歌(GOOG,Gemini)、OpenAI(GPT)、Anthropic(Claude)、xAI(Grok)、亚马逊AWS(Nova)、微软(MSFT)、英伟达(NVDA) * **中国**:月之暗面(Moonshot,Kimi)、深度求索(DeepSeek)、MiniMax、阿里巴巴(BABA,Qwen)、字节跳动(ByteDance,Doubao)、智谱AI(Zhipu,AutoGLM)、中兴通讯(ZTE,Nubia)、百度、快手等[1][3][4][5][45][47][97][101] 核心观点与论据 1. AI数据中心电力需求激增,中美成为最大消费者,但面临不同挑战 * **全球电力需求预测**:生成式AI(GenAI)的快速发展正驱动数据中心大规模建设,导致电力消耗激增[56] 预计全球数据中心耗电量将从2024年的486太瓦时(TWh)增长2.7倍至2030年的1,301 TWh,占全球总耗电量的比例从1.8%升至4.2%[56][114] * **中美主导地位**:美国和中国将是全球最大的数据中心电力消费国,预计到2030年将分别占全球数据中心耗电量的46%和35%[2][19] 预计2030年美国数据中心耗电量将达到604 TWh(占其全国总耗电量的13.2%),中国将达到455 TWh(占其全国总耗电量的4.1%)[61][63][115][117] * **美国面临电力瓶颈**:美国的电力约束更多来自电网基础设施而非发电能力[2][64] 由于电网老旧(部分已运行50-70年)、缺乏联邦协调、没有超高压(UHV)输电网络将低成本绿色电力输送到数据中心密集区,加上审批缓慢和环境法规严格,美国在AI数据中心建设上面临显著电力短缺[2][66][127] 预计到2028年可能出现12吉瓦(GW)的电力短缺[24][125] 许多美国超大规模云服务商报告GPU因电力不足而闲置[127] * **中国电力供应充足**:中国每年发电量增长超过400吉瓦(GW),并已建成超过50,000公里的超高压(UHV)输电网络,将西部的可再生能源输送到东部,因此不太可能面临电力短缺[2][32][70][150] 中国的电网是集中规划、全国协调的,且“东数西算”等国家战略将数据中心有意布局在电力过剩的西部地区(如内蒙古、宁夏、甘肃、贵州)[72][150][158] 2. 电力成本成为AI运营关键因素,中国具有显著成本优势 * **电力成本是AI最重要的运营支出之一**(不包括AI服务器的折旧与摊销)[77][169] * **中美电价差异**:根据估算,美国数据中心加权平均电价比中国高出55%[2] 另一处数据指出,中国主要AIDC枢纽的平均电价比美国低36%[77][169] 具体数据显示,美国加权平均电价为9.9美分/千瓦时,中国为6.4美分/千瓦时[74][168] * **总电力成本预测**:预计美国AI电力成本将从2025年的220亿美元以22%的年复合增长率(CAGR)增长至2030年的600亿美元[2][77] 同期,中国AI电力成本将从130亿美元以17%的CAGR增长至290亿美元[2][77] 图表数据显示,2025E至2030E,美国总IDC电力成本从21.9亿美元增长至59.8亿美元,中国从13.1亿美元增长至28.9亿美元[8][40][76] 3. 中美AI模型性能差距迅速缩小,中国开源模型领先 * **全球模型排名变化**:谷歌的Gemini 3 Pro Preview超越OpenAI的GPT5,成为全球性能最佳的大语言模型(LLM)[1][3][78][80] 月之暗面(Moonshot)的Kimi K2 Thinking超越MiniMax M2,成为中国开发者中性能最佳的LLM,其性能与排名第一的模型差距缩小至8%(上月为10%),目前排名全球第四[1][3][85] * **关键结论**:尽管面临芯片限制和远低于美国的资本支出,中国模型已经赶上了美国模型的性能[3] 中美前沿模型之间的智能差距在三个月内从16%缩小到8%[87][237] * **开源模型对比**:在开源模型领域,中国保持领先 最佳的中国开源模型Kimi K2 Thinking的智能得分比美国最佳开源模型(GPT-OSS-120B)高出11%[240] 谷歌的Gemini 3 Pro是最佳的闭源模型,而Kimi K2是截至2025年12月最佳的开源模型[234] 4. AI智能手机助手展示技术潜力,但商业化前景存疑 * **字节跳动Doubao手机助手**:2025年12月1日,中兴通讯旗下努比亚品牌发布了一款由字节跳动Doubao移动助手驱动的智能手机(努比亚M153,官方售价3499元人民币)[4][45][94][184] Doubao作为操作系统级别的图形用户界面(GUI)代理,通过视觉识别和模拟人类点击、滑动等操作,执行用户语音指令的多步骤任务,展示了智能手机AI的理想形态[4][94][187] * **商业化障碍**:中国关键应用如微信、淘宝和支付宝已阻止Doubao此类访问,这意味着Doubao无法完成用户预期的许多交易/操作,使其不太可能取得商业成功[4][94][187] 主要互联网平台之间对“访问控制”的激烈竞争使得此类服务难以商业化[4] 此外,主要的中国安卓原始设备制造商(OEM)已高度定制其操作系统并开发了自己的应用,不太可能整合Doubao[4] * **替代方案**:智谱AI(Zhipu)于12月9日开源了其移动AI代理AutoGLM 2.0,该方案在云端虚拟手机上运行,避免了与主要应用的冲突,旨在为行业提供开放基础[97][188][192] 5. 美国对华AI芯片出口政策与中国自主化战略 * **英伟达H200芯片**:美国于12月9日批准向中国销售英伟达H200 AI芯片[5] * **中国的态度**:中国对此可能兴趣不高,因其追求AI芯片自主化[5] 一种潜在的折衷方案是要求中国公司每进口一块H200,就必须购买10块或5块本地AI芯片[5] 中国更感兴趣的是获得先进的晶圆厂设备(WFE),以便快速扩大本地AI芯片产能[5] 6. LLM应用成为关键用户入口,中国应用用户增长迅速但货币化滞后 * **LLM应用的重要性**:LLM应用是模型供应商的关键用户入口,能够将碎片化的服务统一到单一平台,并培育能够执行复杂任务的智能体(AI Agent)[98][101][204] * **中国LLM应用用户增长**:截至2025年11月,字节跳动的Doubao是中国最大的LLM应用,月活跃用户(MAU)达到1.679亿[47][101][197] 阿里巴巴在11月将其“通义”应用更名为“Qwen”应用后,MAU大幅增长149%至1830万[47][101][198] 阿里巴巴的Quark(AI网页浏览器)MAU为1.519亿[47][197] * **中美应用对比**:ChatGPT仍然是全球最大的LLM应用,2025年11月全球MAU为7.76亿[201][203] 其他美国主要LLM应用如Gemini、Grok、Perplexity和Claude的MAU分别为8900万、5900万、3200万和670万[201] 尽管中国主要LLM应用已积累了可观的用户基础,但在商业化方面仍远远落后于美国同行,因为大多数面向消费者的使用仍然是免费的[203] 7. 美国为缓解电力短缺采取多种策略,核能被视为终极解决方案 * **缓解策略**:美国超大规模云服务商采取了多种策略来缓解电力短缺问题,包括:将数据中心选址从传统集群(如弗吉尼亚州北部)转移到电网可用性和发电能力高的地区;通过投资现场或邻近数据中心的发电设施(如与核电站共建、小型模块化反应堆SMRs)来绕过输电电网限制;利用从比特币矿场转型而来的AIDC的电力容量;投资先进和替代能源(如核裂变/聚变、地热、太阳能);在其他电力充足且廉价的国家(如南美洲的巴西、智利、哥伦比亚,以及马来西亚)建立AIDC[69][128][130] * **核能的作用**:核能因其24/7连续供电、高功率密度(典型核电站可提供高达1吉瓦的电力)、零碳排放以及相对更容易获得许可等优势,被视为解决美国AIDC能源短缺的终极方案[144] 具体方式包括与现有核电站共建、签订长期电力购买协议(PPA)以及投资核聚变初创公司[149] 8. 水资源短缺可能成为美国AIDC发展的另一瓶颈 * **水资源消耗**:AIDC消耗大量水资源用于冷却高密度GPU集群,一个大型AI数据中心每天可使用高达500万加仑的水进行冷却[173] 根据报告,训练GPT-3消耗了70万升淡水[173] * **水资源压力**:43%的美国数据中心位于高水资源压力地区,如凤凰城、内华达州、德克萨斯州和犹他州[173] * **解决方案**:解决方案包括提高用水效率(WUE)、采用先进的冷却技术(如直接芯片冷却和浸没式冷却),以及将新的AIDC集群转移到水资源丰富的地区(如太平洋西北地区、五大湖区和东北地区)[178] 其他重要但可能被忽略的内容 * **中美AI发展路径差异**:美国数据中心电力消耗占比远高于中国(2030E美国13.2% vs 中国4.1%),这主要是由美国部署用于训练的超高功率GPU驱动,而中国则侧重于仅支持推理[63][117] * **LLM能耗原因**:训练阶段不仅需要前向传播进行预测,还需要后向传播与正确答案进行比较,这需要更多能量,且需要大型GPU集群协同工作、同步和通信,显著增加了能耗[118] 推理阶段长期来看甚至更耗能,一次GPT-4查询消耗约0.34瓦时电力,几乎是典型谷歌搜索能耗的10倍[119] * **冷却系统耗电**:IT系统(如GPU、CPU、HBM、存储和网络)通常占AIDC功耗的70-80%,冷却系统是AIDC内部第二大功耗源[124] 大型AIDC通常需要更耗电的液冷系统[124] * **中国“东数西算”政策细节**:该政策确定了10个数据中心集群,包括京津冀的张北集群、长三角的芜湖集群、粤港澳的韶关集群、成渝的成都/重庆集群,以及贵州、内蒙古、甘肃、宁夏的西部集群[163] 政策旨在通过增加基础设施投资、激励机制和严格的最低利用率(65%)标准,将延迟不敏感的数据从东部迁移到西部[160] * **模型能力细分对比**:在代理能力(Agentic Capability)和编码能力(Coding Capability)方面,美国模型仍然领先[244][248] 在多模态能力(文本到图像、文本到视频)方面,美国实验室也处于领先地位[252] * **幻觉问题**:即使是前沿模型也会产生幻觉,因此在金融、医疗等对幻觉高度敏感的商业场景中,其准确性尚不可接受[243] 中国开源模型比美国同行更容易产生幻觉,但由于开源模型可以被第三方轻松微调或通过RAG增强,中国模型在商业应用生态方面仍有优势[243]
从投出小红书到被朱啸虎炮轰,清华才女能否带领Kimi挤上IPO牌桌?
凤凰网财经· 2025-12-12 21:08
文章核心观点 - 月之暗面公司正加速资本化进程,计划于2026年下半年启动IPO,最新一轮融资目标估值约40亿美元[1] - 公司近期任命前投资人张予彤为总裁,负责战略推进与商业化落地,其个人经历及与昔日投资机构的股权纠纷曾引发关注[1][4][5] - 公司作为AI赛道明星企业,在资本与技术层面表现突出,但面临用户月活排名靠后及商业化路径探索等市场挑战[10][13] 从投资人到操盘手:80后女学霸升任总裁 - 新任总裁张予彤拥有清华大学电子工程系本科及斯坦福大学管理工程硕士学位,曾为金沙江创投主管合伙人,投资过小红书(估值超310亿美元)等明星项目[3][4] - 2023年AGI拐点出现时,受月之暗面创始人杨植麟邀请加入公司,从“幕后推手”转向“台前操盘”[4] - 张予彤擅长融资,其表示公司不追求大而全,而是将擅长的事情做到最好[4] 仲裁与切割:朱啸虎的“手撕”与月之暗面的“绑定” - 纠纷核心源于2024年2月,时任金沙江合伙人的张予彤为月之暗面撬动阿里巴巴超10亿美元投资,使公司估值从3亿美元飙升至25亿美元[5] - 融资完成两个月后,张予彤离职并以“联合创始人”身份介入公司运营,引发前同事朱啸虎强烈反应[5] - 2024年11月,朱啸虎发起仲裁,指控杨植麟等未经循环智能投资人同意便启动融资并成立月之暗面[6] - 朱啸虎后续指出张予彤在月之暗面免费获取了占比初始股份14%的900万股权,远超循环智能所分得的9.5%,并提出若公司与张予彤切割可豁免公司,但公司方坚持绑定张予彤,称其股份按贡献逐步兑现[8][9] 阿里腾讯入局,清华系AI独角兽的资本盛宴 - 公司自2023年6月以来,在不到两年内密集完成5轮融资,累计金额超30亿元,吸引了红杉中国、真格基金等一线VC,并获阿里巴巴与腾讯两大巨头入局[11] - 公司估值从天使轮后的近20亿元,一路飙升至A+轮后的25亿美元,B轮后达到约33亿美元(约合人民币240亿元)[11] - 据2024年11月报道,公司最新一轮融资临近尾声,估值有望攀升至约40亿美元(约合人民币280亿元)[12] - 技术层面,公司于2025年11月发布新一代开源思考模型Kimi K2 Thinking,基于“模型即Agent”理念,可在无人干预下自主完成多达300轮的复杂任务调用[13] - 市场表现方面,据QuestMobile数据,其产品Kimi在国内AI助手月活排名中位居第六,用户约900万,落后于豆包、DeepSeek等竞争对手[13] - 公司最终能否成功上市,取决于其能否找到适配自身技术优势的可持续商业化路径[13]
月之暗面迎来一名女总裁
华尔街见闻· 2025-12-09 21:01
公司核心动态:月之暗面(Kimi)的战略与商业化 - 前金沙江创投主管合伙人张予彤以“Kimi总裁”新身份公开亮相,负责公司整体战略与商业化,包括融资与新产品开发 [1][2] - 公司推出付费会员服务“OK Computer”模式,旨在让用户为节省时间和解决复杂问题的能力付费,打破国内大模型长期免费的传统,是从烧钱换量转向价值变现的关键举措 [6] - 公司最新一轮融资已接近收尾,估值有望冲至40亿美元,并有IPO计划 [6] - 面对用户增长瓶颈,公司收缩了投放预算,策略从“烧钱换量”转向依靠“技术溢价”路线 [4][6] 公司技术能力与市场地位 - 公司最新的开源思考模型Kimi K2 Thinking在HLE和BrowseComp等基准测试中刷新了SOTA记录,据称超越了GPT-5和Grok 4等顶尖模型 [4] - 公司技术底牌包括Muon二阶优化器,首次在万亿参数模型上验证了可行性,使Token效率提升了2倍 [4] - 全球顶尖AI搜索应用Perplexity在其模型列表中,除闭源模型外,唯一接入的就是Kimi K2 Thinking [4] - 公司强调即便只有海外巨头1%的资金和人员投入,依然能重写训练范式,以回应市场对其“后劲不足”的担忧 [3][4] - QuestMobile数据显示,Kimi月活用户数从去年底的2101万下滑至今年三季度末的967万,而同期豆包和DeepSeek月活破亿 [5] 行业竞争格局与趋势 - 中国AI市场呈现清晰的“双寡头”特征:字节跳动的豆包依靠抖音生态日活达5000万,深度求索(DeepSeek)以极致的技术效率和低价策略击穿行业底线,两者切走近半壁江山 [8] - 阿里千问、月之暗面、智谱AI、MiniMax等“六小虎”被夹在巨头生态霸权和DeepSeek的成本优势之间,单纯靠聊天机器人已不足以确立生存空间,进入差异化生存的淘汰赛 [8] - 行业从“百花齐放”固化为“阶层分化”,靠PPT融资的“草莽时代”已结束,下半场是关于获客成本、用户生命周期价值和毛利率的冷酷计算 [8][10] - 大模型公司资本化进程加速,智谱AI已在北京证监局备案辅导,MiniMax也传出IPO规划,给同行带来巨大心理压力 [9] 行业参与者战略调整 - “六小虎”开始痛苦变阵:百川智能重新聚焦医疗垂直领域,试图避开通用模型的竞争;零一万物放弃了万亿参数超大模型研发,转而拥抱DeepSeek模型做To B应用 [8] - 分析师认为大模型市场不会赢家通吃,而是分层共存,在政府、金融等强调安全可控的场景以及企业垂直领域仍有发展机会,关键看商业化落地路径 [9] - 随着基础大模型能力提升,垂直领域在未来1-2年里会有较好的变现机会 [9]