大模型公司不搞浏览器搞Agent,实测找到原因了
量子位·2025-10-31 14:27
产品核心功能 - 产品形态为桌面悬浮球Agent,可直接与本地操作系统交互[3][44] - 具备联网搜索、浏览器操作、Excel表格处理和终端控制能力[6] - 支持通过自然语言驱动计算机系统,实现"为所欲为"的本地操作[2][45] 技术操作能力 - 自动完成编程环境搭建,如下载conda、创建虚拟环境、安装指定包(Python 3.11.13、torch 2.8.0、torchvision 0.23.0等)[9][11][14][19] - 执行过程中自动纠错并修改方法,最终在本地打开Jupyter[15] - 自动升级代码项目,如用Pygame替换tkinter界面、增加分数排行榜功能、修复内存泄漏并生成exe文件[21][24][25] 任务管理特性 - 支持"妙计"功能实现操作步骤复用,如通过"/图片按时间分类"指令快速执行复杂操作[30] - 具备定时任务能力,可设置到点自动执行任务[8][32] - 支持并行处理任务,后台运行不干扰当前工作,任务结束时浮出提醒[8][34] 行业发展趋势 - Agent正打破人机交互边界,过去手动衔接的操作环节被语言指令串联[47] - 多家公司布局桌面Agent领域,如智谱推出主打推理和PPT生成的Agent,MiniMax推出能输出分析报告和代码的"超级员工"[41][42] - 技术趋势从浏览器Agent转向本地操作系统交互,未来人机互动可能像对话一样轻松[40][47] 产品当前局限 - 任务执行速度较慢,环境搭建需以分钟为单位计时[36][37] - 调试代码时对多个错误修改不完全,需多次检查[38] - 目前仅支持Mac系统,Windows版本尚未发布[39]