合集回顾:手机智能体的来龙去脉 4个问题带你看
21世纪经济报道·2025-12-12 08:49

核心观点 - 手机智能体正从简单的聊天助手演变为能直接操作手机的私人助理 这不仅是功能升级 更是对AI生态控制权的重新分配 其发展伴随着技术路线探索、商业博弈和显著的合规风险 [1][3] 核心能力与技术演进 - 手机智能体正改变用户围绕App行事的习惯 主流手机厂商如小米、荣耀、vivo、OPPO、华为、三星及第三方如智谱AI、字节跳动均已推出相关产品 [3] - 发展初期能力有限 今年初现实环境中能成功点外卖的手机智能体不超过3家 实验室任务成功率约70% 但面临成功率低、响应不稳定、耗时长等问题 [3] - 技术方案主要分为三种:意图框架(通过API/SDK调用App功能)、基于视觉的GUI Agent(模拟用户操作屏幕)以及云手机方案(如智谱AutoGLM 2.0的虚拟手机界面) [4][5] - 视觉路线为主流 大多依赖手机的“无障碍权限”以获取系统级控制能力 豆包手机助手通过与中兴合作工程机 探索了为智能体深度定制的AI原生手机形态 [4][5] 隐私与安全挑战 - 视觉路线的手机智能体需分析屏幕所有内容 包括聊天记录、支付密码等 存在隐私泄露风险 并可能降低电信诈骗门槛 [6] - 控制权让渡带来风险 AI幻觉可能导致错误执行 例如智谱AutoGLM被指出多买了优惠券 此外 攻击者可能通过预埋恶意指令诱导智能体泄露隐私或植入病毒 [6] - 高权限应用在缺乏外部约束下易滑向灰色地带 历史上存在利用无障碍服务形成的黑灰产业链 如自动抢红包、手游脚本等 [7] - 行业测评指出多家手机智能体存在无障碍权限使用混乱问题 如结束后权限仍保持打开、未充分提示风险或征求同意 [8] - 行业共识正在形成 倡议手机智能体需事前充分告知并征得用户同意 事中允许用户随时拒绝或终止接管 相关倡议已被吸纳进入行业协会标准 [9] 商业竞合关系 - 手机智能体与互联网App存在根本博弈 智能体若完全替代真人操作 短期将冲击App的拉新率、留存率、用户活跃时长及广告回报率 长期可能导致App被管道化(OTT化) [10] - 豆包手机助手工程机售罄后 用户将其用于在拼多多、抖音极速版等App完成任务 甚至尝试代打《王者荣耀》 直观展示了生态摩擦 [10] - 类似博弈在MCP(模型上下文协议)领域已上演 尽管各大科技公司跟进 但互联网平台因担忧失去场景控制权而抗拒 开放进展不顺利 [10][11] - 互联网App的顾虑包括:开放敏感数据(如用户地址)的安全风险 以及智能体若掌握比价、推荐权 将抽空App的算法优势和商业权力 [11] - 博弈松动的可能触发器包括:技术产品足够成熟以反向逼迫App接入 以及头部平台将争端上升到法规层面争夺“正当性” [11] 生态控制权与规则博弈 - 智能体与互联网平台的授权争端历史悠久 2017年腾讯与华为就数据权益发生冲突 当前豆包手机助手上线一周后即被微信、支付宝、淘宝、王者荣耀等App限制操作 [12] - 法律冲突升级 例如2024年11月亚马逊起诉AI公司Perplexity 指控其浏览器智能体伪装用户操控账户购物 Perplexity则辩称智能体是用户的“代理” [12] - 规则争议焦点集中在两方面:一是代理授权问题 涉及用户授权与App授权的平衡及信息不对称;二是代劳责任问题 如智谱AutoGLM2.0曾“自作主张”加购优惠券导致账单多出7.9元 [13] - 技术界提出建立规则方案 如为智能体开设独立钱包并设定消费边界 提供“撤销-追溯”保障机制 旨在通过技术规则为AI代劳划出可控边界 [14]