AutoGLM Phone Agent
搜索文档
智谱开源“会使用手机的模型”,智能体能否保障个人隐私安全?
中国证券报· 2025-12-09 12:39
公司动态:智谱AI开源AutoGLM模型 - 智谱于12月9日通过微信公众号宣布,开源其核心AI Agent模型AutoGLM [1] - AutoGLM的目标是让AI真正学会“使用手机”,实现从说到做,可在外卖App完成下单、在云手机批量处理通知、在销售客服等场景自动完成重复操作 [1] - AutoGLM于2024年10月25日发布,被业界视为首个具备“Phone Use”(手机操作)能力的AI Agent [1] - 2025年,公司推出AutoGLM 2.0,验证了强化学习的规模扩展定律,并提出MobileRL、ComputerRL和AgentRL算法,通过让模型在上千个虚拟设备环境中同时强化学习,扩展了Agent的准确性和泛化能力 [1] - AutoGLM Phone Agent支持微信、微博、淘宝、京东、美团、抖音、小红书等超50款主流中文应用,可完成启动应用、输入文本、长按、双击等操作,面对登录、输入验证码等敏感操作时会发起人工接管请求 [1] - 智谱为国内头部AI大模型公司,由清华大学团队孵化,致力于打造新一代认知智能大模型 [2] - 公司此前已推出对话模型ChatGLM、开源单卡版模型ChatGLM-6B,并打造了包括智谱清言、CodeGeeX、CogVLM和CogView在内的AIGC产品矩阵 [2] 行业趋势:AI Agent技术发展与应用 - 近期,人工智能技术正向更具实用价值的智能体Agent方向发展,行业希望AI能“长出手脚”,不仅提供建议,还能将建议转为行动 [2] - 豆包于12月1日宣布发布技术预览版豆包手机助手,并与中兴通讯联合推出工程样机nubia M153少量发售,演示中AI助手实现了手机跨App调用,消息引起市场广泛关注,中兴通讯股价当日涨停 [2] - 豆包手机助手在nubia M153上操作手机功能时,被用户发现在部分App出现异常退出甚至无法登录的情况,业内人士认为可能与需要系统级权限相关 [3] - 豆包在后续声明中确认,需要用户主动授权INJECT_EVENTS系统级权限(或类似无障碍权限)才能提供服务,并承诺虽然需要读取屏幕以完成指令,但不会在云端存储用户屏幕内容,且相关内容不会进入模型训练 [3] - 行业人士认为,目前Agent技术仍在探索中,如何平衡使用体验和隐私安全等,需要行业共同努力,开源等方式或有助于加速行业对技术的共同研发 [3] 技术路径与隐私考量 - 由于隐私保护争议和当前手机难以支撑AI Agent模型算力需求,智谱AutoGLM选择不完全部署于手机端,而是在云端运行端侧模型 [3] - 智谱表示,云端运行方案让AI Agent的每一个动作都可以回放、审计、干预,从而将敏感数据隔离 [3] - 在实践中,用户个人隐私保护和网络安全隐忧仍在,以手机智能体为例,将App操作托管给AI需要用户授权屏幕读取权限,引发对个人信息泄露和Agent被灰黑产利用的担忧 [2]