一手体验:首款通用Agent产品Manus,效果如何?
虎嗅APP·2025-03-06 18:23
Manus产品能力 - 首款通用Agent产品Manus在GAIA评分上超越OpenAI的DeepResearch成为第一[7][8] - 整合OpenAI的DeepResearch和Claude的Computer Use功能并能自主编写代码[5] - 具备复杂任务拆解、规划和执行能力可自动在云端运行[23][24] - 交互设计优秀提供实时进度同步和可视化任务步骤[36][37][39] 技术性能 - GAIA测试包含466个多步骤实际问题分为三个难度级别[11][12] - 2023年人类在GAIA测试成功率90%而GPT-4仅15%[14] - 支持PDF转PPT、发票整理、股票分析等复杂任务[25][42][55] - 任务执行时间从几分钟到30分钟不等[40][52][63] 应用案例 - PDF转PPT案例展示完整任务拆解和执行流程[26][27][28][29][30][33][34] - 发票整理案例实现OCR识别和Excel自动生成准确率接近100%[42][43][44][45][49][50][53] - 股票分析案例生成交互式图文报告质量超越OpenAI[56][57][58][59][60] - 开源模型时间线案例展示30分钟生成能力[62][63] 行业影响 - 代表中国团队在AI领域的技术突破[69][70][71] - 将Agent工程推向新高度可能改变行业格局[65][69] - 需要清晰具体的prompt以获得最佳执行效果[66][67] - 2025年3月6日被视为AI发展重要里程碑[68][69]