DevAgent

搜索文档
扣子空间:字节首款Agent,比豆包更像助理
新财富· 2025-04-23 14:41
AI Agent行业发展 - 2025年被预测为"AI Agent之年",Manus的出现让用户首次体验到AI能自主操作电脑、浏览器和编写代码,定义了Agent类产品的基本形态 [2] - 字节跳动于4月18日推出首款toC Agent应用"扣子空间",定位为"通用实习生"与"领域专家",具备无限拓展能力 [4] - 行业竞争焦点已从大模型性能转向工具完善程度,MCP协议成为降低AI调用工具门槛的关键技术 [43] 扣子空间产品评测 - 提供探索模式和规划模式两种开发方式,后者允许用户修改AI生成的思维路径,确保交付结果更符合预期 [5][6] - 在旅行规划测试中,能调用高德地图插件生成可视化行程,但初期攻略颗粒度较粗,经细化要求后可提供包含具体餐馆、价格的高价值攻略 [6][7][8][10] - 成功开发俄罗斯方块HTML游戏并自主添加计分系统,但在更复杂的愤怒小鸟游戏开发中出现较多BUG [14][16][17] - 具备GUI交互能力,能在虚拟机中打开4399网站但受限无法自主游玩游戏 [23] 字节跳动Agent技术布局 - 内部至少有5个团队开发不同Agent产品,包括未公开的DevAgent和开源的Agent TARS [27][29] - TARS采用MCP协议并具备GUI交互能力,其视觉技术支持来自自研UI-TARS大模型,在7个GUI评测基准中取得SOTA表现 [33][34] - UI-TARS-1.5版本在Windows Agent Arena(50步)测试中得分42.1,远超此前29.8的SOTA水平 [34] MCP协议行业影响 - 被类比为"AI时代的HTTP协议",通过统一接口规范解决大模型访问不同数据库的难题 [40] - 字节、阿里等大厂积极布局,阿里在百炼平台、通义千问和蚂蚁百宝箱等产品线接入MCP服务 [43] - 推动互联网数据壁垒打破,使AI能力从简单对话转向实际生产力工具 [43] 行业未来展望 - 扣子空间验证了Agent产品形态的核心定义:调用工具完成复杂任务 [47] - 多数互联网大厂都在研发Agent产品,通义千问正合作开发中文版Manus [47] - Agent产品将快速普及并改变用户生活方式 [47]
扣子空间:字节首款Agent,比豆包更像助理
新财富· 2025-04-23 14:41
核心观点 - 2025年被视为"AI Agent之年",字节跳动推出的扣子空间展现了AI Agent在通用性和交付能力上的突破 [2][4] - 扣子空间基于字节低代码开发平台Coze,具备零代码开发、开放生态和任务自治特点,能快速构建个性化智能体 [4] - AI Agent产品竞争的关键在于大模型性能和工具完善程度,MCP协议成为降低资源调用门槛的核心技术 [48][49] 产品测试表现 功能测试 - 旅行规划测试中,扣子空间5分钟内完成可视化攻略,调用高德地图插件,但初期攻略颗粒度较粗 [7] - 细化需求后,扣子生成的旅行攻略包含餐馆人均价格(如东京天妇罗店约100元)、交通住宿等详细信息,信息准确无幻觉 [11][12] - 俄罗斯方块开发测试一次成功,额外添加计分系统和暂停功能,无BUG [16] - 愤怒的小鸟开发存在物理碰撞BUG,但能完整交付界面 [19][20] - 股票市值动态曲线图需细化需求描述后实现功能 [21][23] - 能打开4399网站游戏但受限无法自主游玩 [26][27] 技术架构 - 提供探索模式和规划模式两种开发模式,后者支持修改AI思维路径 [5] - 采用UI-TARS大模型实现GUI交互能力,在7个评测基准中取得SOTA表现 [38][39] - 支持高德地图、MySQL、Github等插件调用,集成飞书生态实现内容流转 [41] 字节跳动AI战略布局 - 内部至少5个团队开发Agent产品,包括内部工具DevAgent和开源项目TARS [31][33] - TARS定位任务自动化系统,支持MCP协议和GUI交互,技术可能应用于扣子空间 [35][37][38] - UI-TARS-1.5版本在OSworld(42.5分)、Android World(64.2分)等基准超越Claude 3.7 [39] 行业趋势 - MCP协议成为AI时代的HTTP协议,实现工具和数据资源的标准化调用 [44][46] - 阿里巴巴等企业积极布局MCP,通义千问、蚂蚁百宝箱等产品已接入 [50] - 互联网大厂通过MCP打破数据壁垒,推动AI从对话转向生产力工具 [49] - 行业预计将迎来更多toC Agent产品,如中文版Manus等 [53]