Workflow
周末没人讨论 kimi k2?
小熊跑的快·2025-11-10 07:23

文章核心观点 - Kimi K2模型在多项测试中表现优于GPT-5和Claude 4.5 Grok4,属于开源前沿模型[5] - 中国在AI模型追赶和工程压榨算力方面能力突出,差距正在缩小,未来可能实现AI软硬件反向出口[5] 模型技术特点 - Kimi K2是一个围绕一万亿个参数构建的混合专家模型,每次推理激活320亿个参数[2] - 模型将长远推理与结构化工具使用相结合,无需人工干预即可执行多达200-300次连续工具调用[2] - 模型采用修改后的MIT许可证,授予完整的商业和衍生权利,但对月活超1亿或月收入超2000万美元的部署者有显示要求[2] - 开发了MuonClip工具,在15.5T tokens上进行预训练,实现了零训练尖峰,是LLM训练的稳健解决方案[5] - 通过大规模Agentic数据合成技术教模型使用工具[5] 成本与价格优势 - Kimi K2训练成本为460万美元,较DeepSeek的550万美元进一步压缩了算力成本[2] - DeepSeek定价为输入每百万tokens 0.2元,输出每百万tokens 3元[4] - GPT-5定价为输入每百万tokens 1.25美元,输出每百万tokens 10美元[3] 市场表现与影响 - Kimi K2模型目前在社区下载量排名第一[5] - 模型开源并托管在Hugging Face上,有利于迅速打入市场并被广泛接受[2] - 主要媒体对Kimi K2均给予了篇幅报道[1]