Kimi K2 Thinking模型 - 财报，业绩电话会，研报，新闻

Kimi K2 Thinking模型

搜索文档

新浪财经· 2025-12-17 22:25

文章核心观点中国开源大模型在2024年至2025年间实现了全球范围内的领导地位，以DeepSeek、Qwen、Kimi、智谱和MiniMax为代表的国产模型，在性能、价格、生态和可用性等维度上快速逼近甚至超越闭源巨头，正在改变全球AI行业的格局和运行规则 [3][5][116] 全球开源模型排名与格局演变 - 根据AI研究员Nathan Lambert等人的排名，全球开源模型前五名均为中国公司：DeepSeek、Qwen、Kimi、智谱和MiniMax，而OpenAI仅位列第四梯队，Meta的Llama仅获荣誉提名 [3][114] - 2024年曾是Llama主导的天下，但到2025年，国产开源模型已成为全球开发者的默认选择，持续刷新行业选项 [5][116] - 在Hugging Face的热门模型趋势榜上，前四名均为国产开源模型 [86][89] 主要中国开源模型厂商及其技术亮点 - **DeepSeek**：通过混合注意力等机制显著降低成本，打开了高效推理的突破口 [29][98] - **Qwen（阿里巴巴）**：凭借庞大的生态规模，覆盖从4800亿参数到6亿参数的各种尺寸模型，以及视觉语言、代码编写等多领域，几乎渗透整个开源市场 [23][131] - **Kimi（Moonshot AI）**：2025年11月发布万亿参数的混合专家模型Kimi K2 Thinking，采用交错思考技术，一次性能执行300次工具调用，在多个榜单上超越GPT-5和Claude 4.5 [11][122][135] - **MiniMax**：2025年10月底发布MiniMax M2混合专家模型，在综合榜单排名第五，超越Gemini 2.5 Pro和Claude Opus 4.1，其API定价为每百万输入/输出token 0.3美元/1.2美元 [14][124][127][185] - **智谱（Zhipu AI）**：发布GLM系列模型，如GLM-4.5和GLM-4.6，丰富了国产开源生态 [9][10][120] 国产开源模型的竞争优势与市场反馈 - **性能与成本**：国产模型在保持高性能的同时，具备极具竞争力的价格，例如MiniMax M2的价格仅为Anthropic Sonnet模型的1/12 [127][185] - **开发者认可**：海外社交媒体上广泛认可国产模型“好用、便宜”，成为小公司和副业项目的开发首选 [14][124] - **企业应用**：爱彼迎CEO公开表示，中国的开源模型Qwen比OpenAI更适合其实际工作，且更便宜 [25][134] - **具体能力展示**：实测显示，MiniMax M2能一次性生成功能齐全的棋类应用或网站，在处理包含20714个岗位、大小10MB的Excel数据时也表现出色 [16][18][30][35][138][141] 技术路径选择：全注意力与高效注意力之争 - MiniMax M2选择了传统的“全注意力机制”，而非当前流行的稀疏或高效注意力机制，主要原因是全注意力在工业级系统中的性能和可靠性仍然更高 [38][75][144][181] - 高效注意力机制（如线性、稀疏注意力）的核心目标是节省有限的计算资源，但其在复杂推理任务中可能存在隐藏缺陷，且相关基础设施尚不成熟 [41][44][57][147][150][163] - 随着上下文长度需求增长和GPU算力增速放缓，高效注意力的优势未来可能显现，但当前阶段，在质量、速度、价格三角中寻求平衡是关键 [62][75][168][181] 国产开源崛起的驱动因素与行业影响 - **内部竞争与算力限制**：国内模型厂商众多、竞争激烈，且面临算力紧张、芯片受限的困境，开源成为共享算力、避免重复建设、吸引开发者的有效策略 [93] - **构建完整生态**：各厂商通过不同的技术路线（如DeepSeek的成本控制、Qwen的生态规模、MiniMax的智能体能力）共同构建了一个庞大而完整的开源系统，形成了合力 [29][84][97][98] - **改变全球格局**：国产开源模型已成为全球AI生态的底座，全球小团队使用Qwen微调、用DeepSeek做推理基座、用MiniMax做智能体验证已成为常态，导致全球开源生态中心向中国倾斜 [98][109] - **数据佐证**：a16z数据显示，国产开源模型的累计下载量已超过美国模型，且领先优势持续扩大；斯坦福大学2025年AI指数报告也预示国产开源性能将超过闭源和美国模型 [95][97]

阿里巴巴(US:BABA)