Kimi没有DeepSeek的命

文章核心观点 - AI行业技术范式在2025年至2026年间发生关键转变，从注重“聊天”的Chat模型转向注重“行动”的Agent模型 [11][12] - 中国AI公司Kimi在此期间通过技术突破和战略转型，实现了从被市场唱衰到获得全球认可的“逆天改命”，其发展路径与另一家中国公司DeepSeek形成对比 [8][14][22][23][24] - 技术实力、模型实际应用价值（如编程和工具调用）以及开源策略，成为决定AI公司竞争力的核心因素 [12][14][16] 2024年：Kimi的早期定位与市场印象 - 2024年，Kimi凭借“200万字长上下文”的噱头获得市场广泛关注，并成功占据用户“长文本”心智，但其技术影响力在当时并未获得技术圈认可 [4][5][6][7] - 该200万字模型为实验性质，每次运行成本接近3位数人民币，不具备大规模服务可能性 [5] 2025年：行业范式转变与Kimi的转型 - 2025年初，DeepSeek R1因复现并开源OpenAI o1的“深度思考”能力而成为中国AI技术代言人 [8][14] - 同期，AI行业技术范式开始从Chat转向Agent，市场认识到会写代码和调用工具的模型比更会聊天的模型更有价值 [11][12] - 2025年7月，Kimi发布K2模型，主打“Open Agentic Intelligence”，旨在复现Claude模型的Agent能力并开源，标志着公司战略转向 [15] - K2模型发布后，获得英国《自然》杂志积极评价，称其为“另一个DeepSeek时刻”；Anthropic联合创始人Jack Clark评价其编码和工具调用分数已足够高，预计现实中会有人使用 [15][16] - 因K2及后续K2 Thinking模型的表现，Kimi在2025年底完成5亿美元融资，IDG等老股东继续加持 [16] 2026年：Kimi的技术突破与全球认可 - 2026年春节前后，Kimi发布K2.5模型，参数达万亿级别，具备图片和视频多模态理解能力，并支持思考与非思考模式，成为当时少数能发布多模态旗舰模型的创业公司 [18] - 2026年3月，Kimi团队发布“注意力残差”技术论文，挑战已有十年历史的神经网络底层残差连接机制，获得OpenAI联合创始人Andrej Karpathy等人的高度评价 [14][18] - Kimi模型被多家全球领先科技公司采用：被估值3500亿美元的AI编程工具Cursor套壳使用；被市值超过5000亿美元的Cloudflare引入为主力模型；成为全球最大独立AI搜索应用Perplexity唯一引入的开源模型和中国模型 [14][19] - Kimi创始人杨植麟成为英伟达2026年GTC大会唯一受邀演讲的全球独立大模型公司代表，并在演讲中提出优化器、注意力机制、残差连接等基础技术值得重新思考 [14][18][19] - 公司财务表现强劲：K2.5发布后20天收入超过过去一年；2026年春节前后以投前估值48亿、60亿、100亿美元完成总额近20亿美元融资；3月开启的180亿美元估值轮次份额需排队获取 [14][20] - 业务发展受算力制约，市场需求尚有10倍未被满足，部分大厂接入Kimi模型需通过预购获取额度 [21] 中国AI公司发展路径对比 - DeepSeek走极致能效比路线，自研MLA与MoE架构，在2025年凭借DeepSeek R1模型取得突破，为行业带来信心 [23] - Kimi的发展并非一蹴而就，其在2025年初发布Moonlight系列小型MoE模型验证二阶优化器技术，最终应用于K2模型，其采用的Muon优化器已取代沿用10年的Adam，成为行业新标准 [24] - 两家公司均展现出不相信市场格局已定、坚信技术是最大变量、敢于追逐AGI的特质 [25]