Kimi新功能Deep Researcher海外引发热议 还被马斯克直播点名
搜狐财经·2025-07-10 18:15
模型发布 - 马斯克旗下公司xAI正式发布最新旗舰模型Grok 4 [1] HLE测试表现 - OpenAI Deep Research在HLE测试中创下26.6%的新纪录,较之前最高分(o3-mini的13%)翻倍 [4] - Google Gemini 2.5 Pro在HLE测试中得分为21.64%,优于o3(20.32%)但落后于OpenAI Deep Research [4] - 月之暗面Kimi-Researcher以26.9%的成绩创下HLE测试新纪录,超越OpenAI Deep Research和Google Gemini [4] - AI行业在一年内HLE测试成绩从不足5%提升至超过25% [4] Kimi DeepResearcher产品特性 - 在执行研究任务时平均进行23次推理,筛选高质量信息并剔除冗余内容 [6] - 具备自动生成分析结论能力,拥有文献严谨性,可有效减少模型幻觉 [6] - 在xBench DeepSearch基准测试中达到69%的优异表现 [4] 行业评价 - AI从业者高度评价Kimi DeepResearcher,认为其视觉效果出色且研究能力精准 [3] - 海外研究者将Kimi列为中国AI领域前三强,与DeepSeek、字节跳动并列 [4] - 行业人士指出Kimi是基于模型的Agent产品,而非简单工具套用 [4]