Kimi新功能Deep Researcher海外引发热议还被马斯克直播点名

模型发布 - 马斯克旗下公司xAI正式发布最新旗舰模型Grok 4 [1] HLE测试表现 - OpenAI Deep Research在HLE测试中创下26.6%的新纪录，较之前最高分(o3-mini的13%)翻倍 [4] - Google Gemini 2.5 Pro在HLE测试中得分为21.64%，优于o3(20.32%)但落后于OpenAI Deep Research [4] - 月之暗面Kimi-Researcher以26.9%的成绩创下HLE测试新纪录，超越OpenAI Deep Research和Google Gemini [4] - AI行业在一年内HLE测试成绩从不足5%提升至超过25% [4] Kimi DeepResearcher产品特性 - 在执行研究任务时平均进行23次推理，筛选高质量信息并剔除冗余内容 [6] - 具备自动生成分析结论能力，拥有文献严谨性，可有效减少模型幻觉 [6] - 在xBench DeepSearch基准测试中达到69%的优异表现 [4] 行业评价 - AI从业者高度评价Kimi DeepResearcher，认为其视觉效果出色且研究能力精准 [3] - 海外研究者将Kimi列为中国AI领域前三强，与DeepSeek、字节跳动并列 [4] - 行业人士指出Kimi是基于模型的Agent产品，而非简单工具套用 [4]