合集回顾：手机智能体的来龙去脉 4个问题带你看

核心观点 - 手机智能体正从简单的聊天助手演变为能直接操作手机的私人助理这不仅是功能升级更是对AI生态控制权的重新分配其发展伴随着技术路线探索、商业博弈和显著的合规风险 [1][3] 核心能力与技术演进 - 手机智能体正改变用户围绕App行事的习惯主流手机厂商如小米、荣耀、vivo、OPPO、华为、三星及第三方如智谱AI、字节跳动均已推出相关产品 [3] - 发展初期能力有限今年初现实环境中能成功点外卖的手机智能体不超过3家实验室任务成功率约70% 但面临成功率低、响应不稳定、耗时长等问题 [3] - 技术方案主要分为三种：意图框架（通过API/SDK调用App功能）、基于视觉的GUI Agent（模拟用户操作屏幕）以及云手机方案（如智谱AutoGLM 2.0的虚拟手机界面） [4][5] - 视觉路线为主流大多依赖手机的“无障碍权限”以获取系统级控制能力豆包手机助手通过与中兴合作工程机探索了为智能体深度定制的AI原生手机形态 [4][5] 隐私与安全挑战 - 视觉路线的手机智能体需分析屏幕所有内容包括聊天记录、支付密码等存在隐私泄露风险并可能降低电信诈骗门槛 [6] - 控制权让渡带来风险 AI幻觉可能导致错误执行例如智谱AutoGLM被指出多买了优惠券此外攻击者可能通过预埋恶意指令诱导智能体泄露隐私或植入病毒 [6] - 高权限应用在缺乏外部约束下易滑向灰色地带历史上存在利用无障碍服务形成的黑灰产业链如自动抢红包、手游脚本等 [7] - 行业测评指出多家手机智能体存在无障碍权限使用混乱问题如结束后权限仍保持打开、未充分提示风险或征求同意 [8] - 行业共识正在形成倡议手机智能体需事前充分告知并征得用户同意事中允许用户随时拒绝或终止接管相关倡议已被吸纳进入行业协会标准 [9] 商业竞合关系 - 手机智能体与互联网App存在根本博弈智能体若完全替代真人操作短期将冲击App的拉新率、留存率、用户活跃时长及广告回报率长期可能导致App被管道化（OTT化） [10] - 豆包手机助手工程机售罄后用户将其用于在拼多多、抖音极速版等App完成任务甚至尝试代打《王者荣耀》直观展示了生态摩擦 [10] - 类似博弈在MCP（模型上下文协议）领域已上演尽管各大科技公司跟进但互联网平台因担忧失去场景控制权而抗拒开放进展不顺利 [10][11] - 互联网App的顾虑包括：开放敏感数据（如用户地址）的安全风险以及智能体若掌握比价、推荐权将抽空App的算法优势和商业权力 [11] - 博弈松动的可能触发器包括：技术产品足够成熟以反向逼迫App接入以及头部平台将争端上升到法规层面争夺“正当性” [11] 生态控制权与规则博弈 - 智能体与互联网平台的授权争端历史悠久 2017年腾讯与华为就数据权益发生冲突当前豆包手机助手上线一周后即被微信、支付宝、淘宝、王者荣耀等App限制操作 [12] - 法律冲突升级例如2024年11月亚马逊起诉AI公司Perplexity 指控其浏览器智能体伪装用户操控账户购物 Perplexity则辩称智能体是用户的“代理” [12] - 规则争议焦点集中在两方面：一是代理授权问题涉及用户授权与App授权的平衡及信息不对称；二是代劳责任问题如智谱AutoGLM2.0曾“自作主张”加购优惠券导致账单多出7.9元 [13] - 技术界提出建立规则方案如为智能体开设独立钱包并设定消费边界提供“撤销-追溯”保障机制旨在通过技术规则为AI代劳划出可控边界 [14]