智能体赛道发展 - Manus的发布带动了整个智能体赛道的热度,引发开源复现潮和商业闭源产品的竞争[1] - 两个开源项目OpenManus和OWL在Manus发布当天就推出了复现代码[2] - OWL项目由国内CAMEL-AI团队开发,整合了DeepSeek模型到多智能体协作框架中[3][4] OWL项目表现 - OWL在GAIA基准测试验证集上平均分排名第3,在开源项目中排名第1[5] - Level 1分数达到81.13%,超过OpenAI的Deep Research,接近Manus的86.5%[6] - Level 2和Level 3分数仍有差距,但团队表示有信心提升[7] 开源社区动态 - GitHub热榜上Agent相关项目占据主导,MetaGPT和AutoGPT位列前排[8] - Camel-AI和OpenManus使用的代码库browser-use受到关注,金融、编程领域垂直智能体也备受瞩目[9] - MetaGPT项目获得50,504星标,AutoGPT项目获得172,643星标,显示社区高度关注[10] Manus海外扩张 - Manus通过发放邀请码成功打入海外市场,吸引大量用户试用并付费[13][14] - 海外用户反馈Manus在个人信息收集、网站部署、编程任务等方面表现优异[18][19][20][21] - 用户主要抱怨集中在速度较慢和邀请码短缺[23] GAIA基准测试 - GAIA测试由450+复杂问题组成,分为三个难度级别,评估智能体工具使用和自主性[25][26][27] - 人类在Level 2和Level 3的成功率分别为92%和87.3%,GPT-4得分仅为9.7%和0%[28] - Manus在Level 3分数达到57.7%,领先优势明显[29] 行业趋势 - GAIA基准测试正成为智能体产品的必争之地,类似ImageNet在深度学习时代的作用[24][32] - 行业从BERT时代的CLUE基准转向ChatGPT时代的MMLU和ChatBot Arena,现在聚焦GAIA[30][31] - 未来可能出现AgentArena智能体竞技场,进一步推动行业发展[32]
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
量子位·2025-03-09 12:45