Kimi没有DeepSeek的命
虎嗅APP·2026-04-01 23:23

文章核心观点 - AI行业技术范式在2025年至2026年间发生关键转变,从注重“聊天”的Chat模型转向注重“行动”的Agent模型 [11][12] - 中国AI公司Kimi在此期间通过技术突破和战略转型,实现了从被市场唱衰到获得全球认可的“逆天改命”,其发展路径与另一家中国公司DeepSeek形成对比 [8][14][22][23][24] - 技术实力、模型实际应用价值(如编程和工具调用)以及开源策略,成为决定AI公司竞争力的核心因素 [12][14][16] 2024年:Kimi的早期定位与市场印象 - 2024年,Kimi凭借“200万字长上下文”的噱头获得市场广泛关注,并成功占据用户“长文本”心智,但其技术影响力在当时并未获得技术圈认可 [4][5][6][7] - 该200万字模型为实验性质,每次运行成本接近3位数人民币,不具备大规模服务可能性 [5] 2025年:行业范式转变与Kimi的转型 - 2025年初,DeepSeek R1因复现并开源OpenAI o1的“深度思考”能力而成为中国AI技术代言人 [8][14] - 同期,AI行业技术范式开始从Chat转向Agent,市场认识到会写代码和调用工具的模型比更会聊天的模型更有价值 [11][12] - 2025年7月,Kimi发布K2模型,主打“Open Agentic Intelligence”,旨在复现Claude模型的Agent能力并开源,标志着公司战略转向 [15] - K2模型发布后,获得英国《自然》杂志积极评价,称其为“另一个DeepSeek时刻”;Anthropic联合创始人Jack Clark评价其编码和工具调用分数已足够高,预计现实中会有人使用 [15][16] - 因K2及后续K2 Thinking模型的表现,Kimi在2025年底完成5亿美元融资,IDG等老股东继续加持 [16] 2026年:Kimi的技术突破与全球认可 - 2026年春节前后,Kimi发布K2.5模型,参数达万亿级别,具备图片和视频多模态理解能力,并支持思考与非思考模式,成为当时少数能发布多模态旗舰模型的创业公司 [18] - 2026年3月,Kimi团队发布“注意力残差”技术论文,挑战已有十年历史的神经网络底层残差连接机制,获得OpenAI联合创始人Andrej Karpathy等人的高度评价 [14][18] - Kimi模型被多家全球领先科技公司采用:被估值3500亿美元的AI编程工具Cursor套壳使用;被市值超过5000亿美元的Cloudflare引入为主力模型;成为全球最大独立AI搜索应用Perplexity唯一引入的开源模型和中国模型 [14][19] - Kimi创始人杨植麟成为英伟达2026年GTC大会唯一受邀演讲的全球独立大模型公司代表,并在演讲中提出优化器、注意力机制、残差连接等基础技术值得重新思考 [14][18][19] - 公司财务表现强劲:K2.5发布后20天收入超过过去一年;2026年春节前后以投前估值48亿、60亿、100亿美元完成总额近20亿美元融资;3月开启的180亿美元估值轮次份额需排队获取 [14][20] - 业务发展受算力制约,市场需求尚有10倍未被满足,部分大厂接入Kimi模型需通过预购获取额度 [21] 中国AI公司发展路径对比 - DeepSeek走极致能效比路线,自研MLA与MoE架构,在2025年凭借DeepSeek R1模型取得突破,为行业带来信心 [23] - Kimi的发展并非一蹴而就,其在2025年初发布Moonlight系列小型MoE模型验证二阶优化器技术,最终应用于K2模型,其采用的Muon优化器已取代沿用10年的Adam,成为行业新标准 [24] - 两家公司均展现出不相信市场格局已定、坚信技术是最大变量、敢于追逐AGI的特质 [25]

Kimi没有DeepSeek的命 - Reportify