资源不到万亿 OpenAI 的 1% ，Kimi 新模型超越 GPT-5

产品发布与核心能力 - 公司推出开源模型K2 Thinking，是其迄今为止最强的开源思考模型[2] - 模型采用1T参数、MoE架构、32B激活参数、原生INT4量化，并支持256k上下文长度，更好支持国产GPU[3] - 在“人类最后的考试”基准测试中取得44.9%的SOTA成绩，表现超过同类型闭源模型[10] - 模型无需人工干预，可自主实现高达300轮的工具调用和多轮思考能力，解决更复杂问题[6] 技术路径与架构演进 - 从K2到K2 Thinking，技术路径从“模型即Agent”演进到“模型即Thinking Agent”[6] - 模型支持多步工具调用，需将思考内容返回模型进行多次推理以保持连贯性，此能力与Claude的“扩展思考”类似，但OpenAI的GPT系列和Google的Gemini模型尚未支持[21][22][23] - 公司选择先做“交互”再做“反思”的技术范式，重点是多轮工具使用和测试时扩展[16][17][18] - 此技术进展被视为实现AI L3级别的重要突破[20] 行业竞争与资源对比 - 公司估值约为33亿美元，而OpenAI估值为5000亿美元，Anthropic估值为1830亿美元，Grok估值为2000亿美元[28][26] - 公司员工约200人，训练成本约460万美元，而xAI拥有20万块H100 GPU集群，员工超1200人，Grok 4训练成本可能达4900万美元[28][29] - 中国基础模型公司面临资源稀缺挑战，但公司用不到1%的资源实现了对国际巨头的技术超越[29] - 在HLE测试集上，旗舰模型成绩从最初不到20%提升至目前超过40%，显示模型能力持续进步[13]