Workflow
460万美元训练出顶级大模型? 月之暗面杨植麟亲自回应
观察者网·2025-11-11 18:31

模型性能表现 - 月之暗面发布最新模型Kimi K2 Thinking,在Humanity's Last Exam、TAU-Bench等重要基准测试中超越GPT-5、Claude 4.5等全球最强模型 [1] - 在专业机构Artificial Analysis智能体工具调用测试中,Kimi K2 Thinking得分达到93%,为目前第三方机构测量到的最高分 [3] - 在智能指数中,Kimi K2 Thinking以67分排名第3,仅次于GPT5 [3] - 模型在衡量"AI数字员工"能力的TAU-Bench测试中登顶 [6] 技术创新与架构突破 - 模型采用"超稀疏MoE"架构,以极高效率获得万亿级模型的强大知识 [6] - 实现"原生INT4量化",在训练中解决精度与效率的矛盾,大幅提升推理速度并降低硬件门槛 [6] - 在"智能体"工具调用能力上实现质的飞跃 [6] - 模型在一次推理中能保持长思维链,训练时倾向于使用更多思考token以获得最佳效果 [11] - 模型最大支持256K上下文,公司计划在未来的版本中增加上下文长度,并曾尝试过100万个token的上下文窗口 [12] 市场反响与社区热度 - 发布后48小时内下载量已超过5万,成为人工智能全球最大开源社区Hugging Face最热门的开源模型 [6] - Hugging Face联合创始人Thomas Wolf在社交账号上评论,海外开源社区和科技媒体对模型的赞誉纷至沓来 [6] - 模型K2系列不阿谀奉承、直接的文风在AI界受到认可,这种写作风格是模型后训练数据和评估的重要组成部分 [11] - 有用户反馈Kimi在其公司已成为主要测试模型,但生产环境会切换到美国本土模型 [11] 成本与效率对比 - 有传闻称Kimi K2的训练成本仅为460万美元,但公司联合创始人杨植麟坦言此数据不实,称训练成本中很大一部分是研究和实验,难以量化具体数字 [8][10] - 传闻意味着Kimi仅用了OpenAI训练GPT5不到1%的成本就训练出全球顶级大模型,而月之暗面33亿美元估值相比OpenAI的5000亿估值差距巨大 [8] 公司战略与未来规划 - 对于优先聚焦文本模型而非多模态,公司表示训练视觉语言模型需要时间获取数据和调整训练,因此决定先发布文本模型 [10] - 公司目前将专注于模型训练,但会不断更新kimi.com以包含最新功能,没有开发AI浏览器的计划 [12][13] - 公司已发布小型模型Kimi-Linear-48B-A3B-Instruct,未来可能会训练更多模型并添加更多功能 [13] - 针对API按请求次数计费导致资源消耗偏高的反馈,公司回应称此模式能让用户看到费用明细且更符合企业成本结构,但会尽快寻找更好方案 [13] 对质疑的回应 - 对于模型是否专门训练以在HLE基准测试中取得好成绩的质疑,公司回应称在提升智能体推理能力方面取得进展,使其在测试中得分较高,并正努力提升通用能力 [10][11] - 公司通过Reddit的AMA活动集中回应了全球网友对技术细节的大量兴趣和疑问,折射出全球开发者对中国AI创新能力的认可 [8][13]