AI手机助手
搜索文档
阿里千问做成了一部分的“豆包手机”
36氪· 2026-01-15 20:03
阿里千问App战略升级 - 阿里巴巴旗下AI应用“千问”App于1月15日宣布重大升级,核心在于深度整合阿里生态业务,实现AI驱动的购物与服务功能[1] - 升级后,千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,能够实现“一句话点外卖、买东西、订机票、订酒店”等功能[1][4] - 本次升级使千问App版本号跳跃至6.0.5,距离其前身“通义”更名为“千问”并升级至5.0.0版本仅过去两个月[5] 产品功能与能力拓展 - 千问App本次升级后提供超过400项AI办事功能[3] - 新功能包括通过接入“支付宝AI付”和政务服务,实现查询签证、户口、公积金等50项民生服务事项并直达办理入口[4] - 新增“任务助理”功能,面向多步骤复杂任务场景,提供应用开发、办公、咨询、生活办事等能力,并引入“双重核查”机制以降低AI幻觉风险[4] - 相比两个月前的“初代”版本主要提供智能问答、写作、PPT生成等生产力工具,本次升级通过与生态整合实现了功能差异化[5] 实测表现与现存挑战 - 实测显示,千问App在部分场景下功能尚未完善,例如在用户直接下达明确购买指令时,无法直接跳转至淘宝完成下单[7] - 在“生日礼物推荐”用例中,App给出的商品推荐链接存在失效情况[8][9] - 在淘宝闪购下单前,App无法完成代领优惠券的操作[8] - 行业观察指出,千问App在初步打通几大经典应用场景后,仍需持续进化以优化生态协同体验[6][9] 行业竞争格局与阿里优势 - 在千问App更新前,打造“AI手机”或AI助手是手机公司和大模型厂商的重点目标,例如荣耀、智谱AI、字节与中兴合作的豆包AI手机等均有过类似尝试[10] - 然而,这些尝试受限于微信等高频App的操作权限未开放,或采用云端执行导致体验不佳,均未演变出大规模用户生态[11] - 千问App的核心优势在于背靠阿里内部横跨电商、支付的国民级产品生态,得以在数个经典消费场景中完成行为闭环,这构成了其最强护城河[11][13] - 阿里巴巴的C端应用生态以及充足的云计算、AI技术研发资源,是千问App能在“AI手机助手”市场后发先至的原因[13] 生态壁垒与增长限制 - 千问App的增长面临“天花板”,因其功能仅能在阿里生态内部打通,无法实现跨电商平台比价、订票等功能[13] - 行业评价认为千问App“能用,但不够极致”,在阿里将外部竞争者拒之门外的同时,千问App在其他互联网生态中也成为“他者”[13] - 当前移动互联网生态不够开放,一个安全而开放共创的AI手机生态仍是行业愿景[11][13]
仅仅四小时!他做出了豆包手机平替产品“肉包”
中国经营报· 2025-12-20 04:29
文章核心观点 - AI手机助手的技术实现门槛相对较低,但面临数据标注、系统权限、商业模式及平台生态壁垒等核心挑战,其发展受制于大厂封禁、安全隐私与责任界定等深层次问题 [2][6][7] 行业动态与市场反应 - 字节跳动与中兴通讯联合推出的“豆包AI手机”(努比亚M153工程样机)在12月开售后迅速售罄,二手平台成交价一度接近发售价的两倍 [1] - “豆包手机助手”因触发风控机制,被微信、淘宝、美团及多家银行类App限制登录或禁止AI操作 [1] - 在豆包手机引发关注后,个人开发者李云龙在四小时内开发出类似开源项目“肉包”,该项目在GitHub上星标数持续攀升,受到大量开发者关注 [1] - 荣耀在Magic8和Magic7发布会上已演示过AI操控手机的能力,例如“一句话点咖啡” [4] - 在豆包手机被主流App封禁后,智谱开源了“会操作手机的AI”AutoGLM,阿里也发布了同类开源项目Mobile Agent [4] 技术实现与方案对比 - “肉包”初版开发仅耗时四小时,其中99%的代码由AI生成,开发者仅写了约十行代码 [3] - “肉包”调用包括Claude、ChatGPT在内的六款AI助手协同完成UI设计、前后端开发与测试部署 [3] - 核心原理是通过高权限工具截取屏幕画面,利用多模态大模型识别界面元素,再结合模拟点击等操作实现对应用的自动化控制 [3] - “肉包”采用多智能体架构,包含管理者、执行者、反思者和记录者角色,使AI具备从错误中学习的能力 [3] - 阿里Mobile Agent和智谱AutoGLM(开源版)需连接电脑作为中转,而“肉包”完全运行于手机本地,降低了使用门槛 [4] - “肉包”底层依赖阿里通义千问VL通用大模型,需上传整屏截图至云端分析,导致响应迟缓,演示中完成B站搜索点赞任务耗时2分54秒,而豆包手机仅需十几秒 [6] - 豆包手机通过获得系统级权限、使用针对手机操作场景微调的小模型,并对主流App进行人工标注,实现了更精准高效的控制 [6] 核心挑战与行业壁垒 - 数据标注是提升AI手机助手效率的关键,若将“肉包”训练至豆包手机助手水平,至少需要300万元投入和三到四个月时间 [7] - 标注需专业团队对每个应用界面进行详细标记,例如需分别标注折叠屏与直面屏的显示差异 [7] - 大厂封禁AI助手主要因其行为模式被识别为非人类操作,且AI会冲击平台依赖“用户打开App—浏览页面—点击广告”构建的传统流量变现模型 [8] - 大厂自身纷纷推出内置AI服务,如腾讯“元宝”、美团“小美”、字节“豆包”、阿里“夸克”和“通义千问”,旨在将用户锁定在自家生态内 [9] - 手机厂商对开放系统底层权限持谨慎态度,因一旦开放给AI,也可能被“黑灰产”和诈骗者利用 [10] - AI手机助手面临责任归属难题,目前在支付等关键环节均强制用户二次确认,将最终决策权留给人类以规避责任纠纷 [11] 商业模式与生态博弈 - AI助手能直接完成订餐、购物等操作,使用户无须浏览首页和观看广告即可直达目标,直接冲击了淘宝、美团等平台依赖用户停留时长和广告投放的传统盈利模式 [8] - 理想的商业路径被认为是由手机厂商作为整合者,与头部App达成授权合作,在系统底层预留安全可控的AI代理接口,以保障用户体验并让各平台保留数据主权 [10]
四小时 他做出了豆包手机平替“肉包”
中国经营报· 2025-12-17 17:00
行业核心事件与产品动态 - 字节跳动与中兴通讯联合推出的“豆包AI手机”(努比亚M153工程样机)于12月限量发售,开售后迅速售罄,二手平台成交价一度接近发售价的两倍[1] - 豆包手机助手展示了跨应用自动比价、订票、智能管家等功能,但很快被微信、淘宝、美团及多家银行类App限制登录或禁止AI操作[1] - 产品经理出身的投资人李云龙在豆包手机引发震动后,自行开发了类似产品“肉包”,该项目在开源社区GitHub上星标数持续攀升,获得大量开发者关注[1] AI手机助手的技术实现与门槛 - “肉包”项目的初版开发仅耗时四小时,其中99%的代码由AI生成,开发者仅写了约十行代码[3] - 开发过程调用了包括Claude、ChatGPT在内的六款AI助手,分别负责UI设计、前端开发、后端逻辑与测试部署[3] - “肉包”核心原理是通过高权限工具截取屏幕画面,利用多模态大模型识别界面元素,再结合模拟点击、滑动等操作实现对手机应用的自动化控制[3] - 该工具采用多智能体架构,包含管理者、执行者、反思者和记录者等角色,使AI具备从错误中学习的能力[3] - 技术门槛并不高,真正的挑战在于模型优化、数据标注、系统权限获取以及可持续的商业模式[2] 行业竞争格局与开源生态 - 在豆包手机被主流App封禁后,智谱开源了“会操作手机的AI”AutoGLM,阿里也发布了同类开源项目Mobile Agent[4] - 阿里Mobile Agent和智谱AutoGLM(开源版)均需连接电脑作为中转,而“肉包”则完全运行于手机本地,降低了用户使用门槛[4] - 豆包手机问世前,荣耀已在发布会上演示过AI操控手机的能力,例如“一句话点咖啡”的场景[4] - 各大厂纷纷推出内置AI服务,如腾讯的“元宝”、美团的“小美”、字节跳动的“豆包”、阿里的“夸克”和“通义千问”,形成“围墙花园”[9] 性能瓶颈与核心技术壁垒 - “肉包”在演示中执行“在B站搜索关键词视频并点赞”任务时,整个流程耗时2分54秒,而豆包手机预计只需十几秒[6] - 性能瓶颈源于“肉包”底层依赖阿里通义千问VL通用大模型,每一步操作都需要上传整屏截图至云端进行分析,导致响应迟缓[6] - 豆包手机体验流畅得益于其“封闭性”:仅适配单一机型努比亚M153,聚焦国内几十个高频App,通过深度标注与专属模型实现精准控制[6] - 数据标注是提升效率的关键,豆包手机投入重金对主流App进行了人工标注,而“肉包”及大多数开源项目缺乏标注资源[6] - 据估算,若要将“肉包”训练至媲美豆包手机助手的水平,至少需要300万元投入和三到四个月时间[7] 商业利益冲突与平台封禁 - 大厂封禁AI助手(如微信、淘宝、美团封禁豆包手机和“肉包”)是因为其行为模式被识别为非人类操作,且不愿开放接口[8] - 封禁本质上是出于商业利益考量,AI助手会直接冲击平台依赖“用户打开App—浏览页面—点击广告”构建的传统流量变现模型[8] - 360集团创始人周鸿祎指出,AI助手让用户无须浏览首页、观看广告即可直达目标,直接冲击了传统流量逻辑[8] - 一旦AI助手试图成为跨平台的“超级入口”,便直接威胁到了现有利益格局,这解释了豆包手机在接入微信、淘宝时遭遇抵制的原因[9] 行业面临的深层挑战 - 手机操作权限与安全之间存在矛盾,手机厂商对用户隐私和品牌声誉高度敏感,不敢贸然开放系统底层权限[10] - 一旦开放权限给AI,也意味着黑灰产和诈骗者可能利用这些接口[10] - 理想的路径是由手机厂商作为整合者,与头部App达成授权合作,在系统底层预留安全可控的AI代理接口[10] - AI手机助手的终极障碍是责任界定,目前豆包手机助手和“肉包”均在支付及其他关键环节强制用户二次确认,将最终决策权留给人类以规避责任纠纷[11] - 法律人士指出,对于涉及敏感信息的App,监管部门应对AI代操作系统、使用App的行为作出必要限制,例如严禁授予AI操纵财产的权限[11]
豆包助手在争议中出圈,业内人士称有系统级权限不等于高风险
南方都市报· 2025-12-15 18:23
豆包助手产品发布与市场反应 - 字节跳动与中兴合作推出的豆包手机(努比亚M153)于12月1日小批量发售,内置的豆包助手能通过理解指令、读取屏幕信息并自动点击来执行任务 [1] - 手机发售迅速拉动了中兴通讯等相关A股概念股走强 [1] - 发售次日(12月2日起),微信、淘宝、支付宝、美团等多个国民级APP相继将豆包助手“拉黑”,限制其操作能力 [1] - 12月5日,豆包助手官方回应称,已限制助手刷激励、调用金融类应用等能力,并正积极与各应用厂商沟通 [1] - 12月10日,豆包助手在用户群发布消息,称阿里系部分应用已陆续解除对设备登录的限制,同时豆包助手也关闭了对阿里系相关APP的操作能力 [1] 豆包助手的技术原理与核心优势 - 豆包助手能执行50步以上的复杂任务,用户感觉其成功率约80% [4] - 与依赖“无障碍权限”的前台运行AI助手不同,豆包助手通过与手机厂商合作,获得系统级权限,可在后台运行 [5] - 其核心技术是调用操作系统级的INJECT_EVENTS(事件注入)权限来实现操作点击,该权限已存在十多年,并被多家手机厂商的AI助手使用 [6][12] - 豆包助手通过系统框架创建“虚拟屏”或“影子系统”来执行任务,比通过无障碍权限读屏和模拟点击更流畅 [5] - 与“剧本式”的传统手机助手不同,豆包助手依靠模型对屏幕的视觉理解、元素定位和推理规划能力来执行任务,具备更强的泛化能力和更长的任务链执行能力 [13] - 未选择API接口方案,因提供接口的APP有限且开放能力有限,难以满足泛化和长尾需求 [14] 关于安全与隐私的讨论 - 豆包助手调用INJECT_EVENTS等系统级高危敏感权限,引发了公众对安全风险和隐私泄露的担忧 [1][15] - 业内人士认为,将高危敏感权限直接等同于高风险是误区,风险取决于使用该权限的应用主体,正规商业公司通常不会用于恶意行为 [2][15] - 针对黑客劫持助手的担忧,业内人士指出支付等关键操作仍需用户手动确认,且恶意任务会被安全机制拒绝 [16][17] - 针对“全天候监控”的担忧,业内人士指出持续监控会导致手机电量消耗巨大且运营成本显著增加 [17] - 根据《隐私安全白皮书》,用户偏好等“全局记忆”信息存储在设备端侧 [18] - 任务执行中,屏幕视觉信息需上传云端进行推理,但官方声明所有屏幕内容和操作过程不会在服务器端存储或用于模型训练 [20] - 云端存储的是用户与豆包的聊天记录(输入输出),而非屏幕原始图像,因此识别出的结果(如银行卡余额)可在不同设备同步,但原始图像未被保存 [21] - 操作过程对用户可见、可控,用户可随时切换到前台监督或人工接管,以建立信任 [22] 行业合作与生态博弈 - 业内人士将此次“工程样机”发售视为一次“打样”,旨在收集用户反馈并推动行业合作,是与手机厂商进一步合作的“敲门砖” [1] - APP厂商的强烈风控反应出乎意料,可能是将搭载豆包助手的手机设备整体纳入了风控范围 [24] - 尽管多个头部APP限制调用,但AI助手价值在于覆盖长尾、泛化的需求,应用商店有百万数量级的APP可供操作 [25] - 目前豆包手机发售量非常有限,对行业流量格局尚不构成任何实质影响,现阶段谈AI入口为时尚早 [2][25] - 业内对“双重授权”(即AI助手除用户授权外是否需第三方APP授权)存在争议,目前尚无具有强制法律效力的监管规则禁止此类操作 [26] - 部分APP平台协议中禁止自动化程序,主要是针对传统爬虫和黑灰产,而AI助手被视为对用户意愿的自动化执行 [27] - 未来可能出现应用厂商对AI助手态度分化的局面,更开放的APP可能获得更多被使用的机会 [25]
豆包手机遭「五大派」围剿,实测23款主流App,哪些「使不动」?
新浪科技· 2025-12-10 15:25
文章核心观点 - 豆包手机助手作为一款创新的AI手机助手,在发布后引发了巨大关注和争议,其核心功能在经历主流App的“风控墙”限制后,部分功能仍得以保留,展现了强大的实用性和技术潜力,但其发展也面临着来自隐私安全、商业利益冲突和生态重塑的严峻挑战 [3][6][26] 产品功能与用户体验实测 - 在记者实测的23款主流App中,有15款App(如滴滴、QQ、京东)可正常登录并通过AI操作,3款App(微信、高德地图、大麦网)可手动登录但无法通过AI操作,5款App(淘宝、美团、支付宝、拼多多、猫眼)直接无法登录,总计8款App功能受限 [4] - 受限的8款App主要隶属于腾讯、阿里巴巴、美团、拼多多及光线传媒五家大厂,此外,官方出于金融安全和游戏公平考虑,主动限制了银行类及游戏类应用 [4] - AI助手能够精准识别并关闭各类App弹窗和广告,成功率极高,极大提升了操作效率 [8] - 在执行任务时展现出高度灵活性,例如在导航任务中,当高德地图受限后会自动尝试打开百度地图;在P图任务中,尝试了4条不同路径直至完成任务 [13] - 具备一定的记忆和主观判断能力,能根据用户历史记录(如便签中的“想吃猪脚饭”)来理解模糊指令(如“订一份晚饭”),并在外卖凑单时自主选择推荐商品 [16] - 存在局限性:处理海量信息任务(如查询大量高铁票)时可能自动停止;在判断“传唱度最高歌曲”等复杂任务时可能出错;更新后无法执行涉及用户账户激励体系的操作(如看广告领VIP) [19] 核心技术支撑 - 豆包手机助手实现“丝滑”体验的关键在于其拥有系统底层的`INJECT_EVENTS`权限,允许其在后台执行任务而不占用前台屏幕,这与仅能通过“无障碍权限”在前台模拟操作的第三方方案有本质区别 [21] - 其图形界面操作能力基于字节自研的UI-TARS模型(闭源版本),该模型针对移动端(Mobile Use)进行了大量优化,提供了“阅读理解手机屏幕”的关键技术支撑 [22] - 技术专家指出,豆包手机助手采用了端云协同架构,本地处理个性化任务,云端负责专业化任务,这是未来端侧智能的发展方向 [25] 面临的挑战与行业影响 - 豆包手机助手因其高系统权限和自动化操作能力,触及了众多App的风控机制,被部分应用识别为异常或机器代理操作(类似“猫池”),从而导致登录和功能限制 [24] - 其更深层的挑战在于可能颠覆现有移动互联网商业模式:AI助手在后台自动化完成任务,使用户跳过开屏广告、弹窗等环节,这将严重削弱依赖广告和流量变现的App的商业价值,使其有沦为“通道”的风险 [26] - 第三方App可以通过获取设备信息或检测`INJECT_EVENTS`权限等运行环境来识别并阻断豆包手机助手的操作 [27] - 行业专家认为,要解决利益冲突,需要构建一个紧密协调的联盟来重塑生态,但这非常困难;更现实的路径可能是从特定场景(如工作场景)开始切入 [27][28] - 法律专家指出,在获得用户明确授权且合规的前提下,AI代理用户访问第三方应用是用户意志的合法体现,行业处于初期,需以包容审慎态度对待创新 [28]
豆包手机遭“五大派”围剿,实测23款主流App,哪些“使不动”?
新浪财经· 2025-12-10 14:35
豆包手机助手功能现状与第三方App兼容性 - 在记者于12月8日实测的23款主流App中,有8款App使用受限,其中5款(淘宝、美团、支付宝、拼多多、猫眼)直接无法登录,3款(微信、高德地图、大麦网)可手动登录但无法通过AI操作 [4][28] - 其余15款App(包括滴滴、QQ、京东等)的使用完全不受影响,既可登录也可通过AI操作 [4][28] - 被限制功能的8款App分别隶属于腾讯、阿里巴巴、美团、拼多多以及光线传媒五家大厂旗下,但大厂限制并非“一刀切”,例如腾讯的QQ和阿里的夸克仍可正常被调取 [4][30] 豆包手机助手核心功能与用户体验 - AI助手能够精准识别并点击关闭各类App弹窗广告,找到指定功能入口,成功率极高,很少误点广告 [5][31] - 面对App的引诱式选项(如购买机票时的附加服务),AI助手能清楚分辨并进行提示,咨询用户选择 [8][34] - AI助手具备高度灵活性,能尝试不同路径解决问题,例如在导航任务中,当高德地图受限后自动切换至百度地图 [11][37] - 在复杂任务中展现强大适应能力,例如为完成B站评论任务,AI助手耗时8分钟回答了60道考题,帮助账号升级至LV2后发表评论 [11][37] - AI助手能理解模糊指令并基于记忆做出选择,例如根据用户之前提到的“猪脚饭”来推荐晚餐,并在外卖凑单时自主选择推荐商品 [14][40] 豆包手机助手的技术实现与权限 - “丝滑”体验源于系统层授予的INJECT_EVENTS权限,使AI助手能在后台执行任务,用户感知无感 [17][44] - 与第三方App通过“无障碍权限”实现前台模拟操作不同,豆包助手拥有系统底层权限,具备真正的后台执行能力 [18][44] - 其图形界面操作能力建立在字节自研的UI-TARS模型基础上,豆包手机使用的是针对移动端优化的闭源版本,性能优于开源版本 [19][45] - 官方澄清INJECT_EVENTS权限需用户主动授权才可调用,否认存在黑客行为 [20][46] AI手机助手面临的挑战与行业影响 - 主要挑战来自隐私安全担忧和打破现有商业模式的阻力 [21][47] - AI助手通过后台操作跳过广告和弹窗,可能使App的商业价值大打折扣,沦为“通道”,这动摇了移动互联网“割地为王”的流量生态,是许多App进行抵制的根本原因 [21][22][47][48] - 第三方App可通过检测设备运行环境或INJECT_EVENTS权限来识别并限制豆包手机,这是其遭遇“风控墙”的技术原因 [22][48] - 专家指出,解决利益冲突需形成紧密联盟以重塑生态,但目前过于理想,从特定场景(如工作场景)切入更为可行 [22][48] - 行业观点认为,在用户授权合规前提下,AI代理用户是用户意志的合法体现,应对创新技术持包容审慎态度 [23][49]
23款App8款“使不动”:“五大派”围剿豆包手机 实测来了
新京报· 2025-12-10 14:25
产品发布与市场反应 - 豆包手机助手于12月1日随豆包中兴合作工程样机nubia M153发布,发布后迅速引发科技圈高度关注,并出现手机“一机难求”的现象 [1] - 发布后随即遭遇一系列争议与限制,包括12月3日微信异常退出引发的权限争议,以及后续几日接连遭到第三方产品限制登录 [1] 第三方应用兼容性与限制现状 - 根据12月8日实测,在测试的23款主流App中,有15款可正常登录并通过AI操作,包括滴滴、QQ、京东、抖音、WPS、爱奇艺、网易云音乐、今日头条、携程、去哪儿、小红书、夸克、百度地图、QQ音乐 [2][3] - 有8款App使用受限,其中5款完全无法登录(淘宝、美团、支付宝、拼多多、猫眼),3款可手动登录但无法通过AI操作(微信、高德地图、大麦网) [2][3] - 实施限制的8款App主要隶属于腾讯、阿里巴巴、美团、拼多多及光线传媒五家大厂 [3] - 豆包手机助手官方表示,出于金融安全和游戏公平考虑,已对银行等金融类应用及游戏场景应用进行了限制 [3] AI助手核心功能与用户体验 - AI助手能够精准识别并点击关闭App内的广告弹窗,或等待弹窗消失,成功率极高,很少误点广告 [4][5] - 在执行任务时能清晰分辨引诱式选项,例如在购买机票时主动提示用户是否添加附加服务 [7] - 面对任务执行障碍时展现出灵活性,会尝试不同路径解决问题,例如在导航任务中,当高德地图受限后自动切换至百度地图 [9] - 在复杂任务中能通过多次尝试完成目标,例如为完成B站评论任务,其花费8分钟回答了60道题以帮助账号升级至LV2 [9] - 具备一定的记忆力和“主见”,能根据用户历史偏好(如曾提及想吃猪脚饭)来理解模糊指令,并在外卖凑单场景中主动推荐商品(如卤蛋和卤丸子) [12] 技术实现与系统权限 - 豆包手机助手流畅体验的核心在于其拥有系统底层的INJECT_EVENTS权限,允许其在后台执行任务,而无需占用前台屏幕,这与仅依赖“无障碍权限”的第三方方案有本质区别 [16][17] - 其图形界面操作能力建立在字节自研的UI-TARS模型基础上,该闭源版本针对移动使用进行了大量优化,性能优于开源版本 [17] - 网络安全专家指出,豆包手机相当于拥有“万能钥匙”,其后台操作行为可能触发其他App的风控机制,被误判为机器代理操作(如黑灰产“猫池”)从而导致登录受限 [18] 当前功能局限与挑战 - 在处理信息量过大的复杂任务时可能失败,例如因当日车票数量过多,执行购买特定日期高铁票的任务在数分钟后自动停止 [15] - 在执行某些需要理解内容流行度的任务时可能不准确,例如播放“传唱度最高”的歌曲时,仅播放了歌手歌单列表中的第一首 [15] - 在12月5日更新后,无法执行涉及用户账户激励体系的操作,如观看广告领取VIP时长 [15] - 专家指出,对于需要实时响应的场景(如高清视频理解),其响应速度尚不足 [15] 行业影响与商业模式冲突 - AI手机助手的出现可能彻底打破现有移动互联网App“割地为王”、依靠开屏广告和弹窗获取流量与收入的商业模式 [19] - 例如,通过AI助手在后台完成“放歌”指令,用户将跳过所有广告,这可能导致音乐App等沦为纯粹的“通道”,商业价值大打折扣 [19] - 第三方App可以通过检测设备信息、系统权限(如INJECT_EVENTS)来识别并阻断豆包手机助手的操作 [20] - 专家认为,要解决利益冲突,需要形成紧密的产业联盟来协调利益,但这过于理想,本质上是一个重塑生态的过程 [20] - 另有观点认为,从特定垂直场景(如工作场景)切入,可能是应对第三方封杀更可行的路径 [20] 法律与行业展望 - 法律专家认为,在获得用户明确授权且个人信息处理合规的前提下,AI代理用户访问第三方应用是用户意志的合法体现,行业应对此类创新技术持包容审慎态度 [21] - 行业观点认为,AI带来的变革和用户需求是真实存在的,豆包与中兴的探索是一个开始 [21]
23款App8款“使不动”:“五大派”围剿豆包手机,实测来了
贝壳财经· 2025-12-10 14:16
豆包手机助手功能现状与第三方限制 - 豆包手机助手在12月1日发布后引发高度关注,但随后遭遇第三方应用限制,其核心AI助手功能受到部分影响[1] - 记者于12月8日实测23款主流App,其中15款可正常登录并通过AI操作,3款可手动登录但无法通过AI操作,5款直接无法登录[3] - 功能受限的8款App分别隶属于腾讯、阿里巴巴、美团、拼多多以及光线传媒五家大厂[4] - 豆包手机助手官方在12月5日表示,出于金融安全和游戏公平考虑,已对银行等金融类应用以及游戏场景应用进行限制[4] - 大厂对豆包手机的限制并非“一刀切”,例如腾讯旗下的QQ和阿里旗下的夸克仍可被正常调取[6][20] AI助手核心功能与用户体验 - 豆包手机助手能够精准识别并点击关闭App弹窗广告,成功率高,很少误点进入广告[7][8][22] - 助手能清楚分辨App的引诱式选项,例如在购买机票时主动提示用户是否添加附加服务[10][11][25] - 助手在执行任务时展现出灵活性,当一条路径受阻时会尝试其他路径,例如导航时在高德地图受限后自动切换至百度地图[14][28] - 助手能处理复杂突发任务,例如在哔哩哔哩评论需答题升级时,其花费8分钟回答了60道题,最终完成任务[14][28] - 助手具备一定的记忆和主观判断能力,能根据用户历史输入(如“想吃猪脚饭”)来理解模糊指令,并在外卖凑单时自主选择推荐商品[34] 技术实现与系统权限 - 豆包手机助手流畅体验的背后,是系统层授予的INJECT_EVENTS权限,使其能在后台执行任务,不占用前台屏幕[38] - 该权限属于“系统签名权限”,豆包手机助手官方在12月3日辟谣,强调只有用户主动授权才可调用,不存在黑客行为[41] - 第三方App通常只能通过无障碍权限实现“读取屏幕+模拟点击”,会占用手机前台,而豆包助手拥有系统底层权限[38] - 助手图形界面操作能力基于字节自研的UI-TARS模型闭源版本,该版本针对移动使用进行了大量优化,提供了关键技术支撑[39] - 网络安全专家指出,App可通过获取设备信息或检测INJECT_EVENTS权限来识别并阻断豆包手机,这是其被设限的技术原因[44] 面临的挑战与行业影响 - AI手机助手面临两大难关:用户隐私安全担忧,以及打破现有商业模式所面临的阻力[42] - 助手能在后台无感操作,这可能使App的开屏广告、弹窗等商业化手段失效,导致其商业价值打折,从而引发抵制[43][44] - 专家认为,AI手机助手可能被App的风控机制判定为机器代理操作或黑灰产工具,从而限制登录[41] - 行业专家指出,要解决利益冲突,可能需要形成一个紧密的联盟来协调利益,但这过于理想,是一个重塑生态的过程[45][46] - 面壁智能首席科学家刘知远建议,从特定场景如工作场景开始切入可能更有机会,因为被第三方App封杀是一定会发生的[47]
抖音副总裁李亮:AI手机助手本质是“机主”授权
凤凰网· 2025-12-08 22:52
公司产品定位与功能阐述 - 抖音集团副总裁李亮以打车场景为例 说明其“豆包手机助手”通过调用地理位置、打车软件、地图导航、路况信息、支付等多个App及数据 在用户授权下丝滑完成任务 [1] - 公司强调“豆包手机助手”的所有操作均需经过用户授权 所有权限使用已在官网隐私安全白皮书中明确披露 [1] - 公司明确否认产品存在“入侵”、“越权”或“黑客”行为 称相关说法为谣言 [1] 行业技术发展与前景展望 - 公司高管认为 上述打车场景仅是AI数以万计应用中最普通的场景之一 [1] - 公司高管判断 距离实现此类AI助手广泛应用的路径已经很近 但同时又困难重重 并认为这些终将都会实现 [1]
用豆包手机的这两周,我好像卷入了一场新与旧的战争。
数字生命卡兹克· 2025-12-08 10:47
豆包手机助手遭遇封禁事件 - 搭载豆包手机助手的努比亚手机首批3万台现货全部售罄 [2] - 作者作为早期测试用户,因使用豆包手机助手执行微信任务,导致个人微信账号被限制登录 [15][19] - 随后阿里系应用(支付宝、淘宝、闲鱼、盒马)及腾讯系应用(QQ)等主流APP相继对账号进行封禁或限制调用,严重影响日常使用 [19][21][25] - 豆包手机助手自身也进行了功能限制,导致涉及主流APP的任务无法执行 [25] AI手机助手与超级APP的入口之争 - 互联网发展史是控制入口的战争,从浏览器、搜索框到如今的超级APP(如微信、抖音)[30] - AI手机助手(Agent)旨在成为用户与所有服务之间的统一入口,用户只需与AI对话,由AI协调后端服务,这压缩了超级APP原有的用户交互和变现链路 [31][40][42] - 这种模式对超级APP构成“生死存亡级别的威胁”,因为用户将不再直接与平台交互,平台可能从主导者退化为服务提供者 [42][46][51] - 当前各大超级APP对豆包的封禁,被类比为历史上铁路威胁漕运利益时,旧有利益集团对新技术进行的阻挠 [32][34][35] Agent技术发展趋势与挑战 - 当前隐私问题的根本解决方案在于端侧推理:随着手机芯片算力提升和模型压缩技术进步,未来小型化模型(如8B或9B参数)可在设备本地运行,确保用户数据完全不离开手机 [49][50] - 技术发展路线明确:端侧算力提升、视觉模型压缩、系统级能力增强是必然趋势,封禁无法从根本上阻止该技术方向 [63][64] - 技术实现路径清晰,但核心挑战在于“利益的再分配”,即现有掌握入口的巨头不愿放弃其主导地位 [51] 对行业格局的长期影响 - AI Agent与超级APP的对抗,是继搜索vs门户、电商vs商场、移动互联网vs PC之后的新一轮入口之争 [60][61] - 历史规律表明,新秩序诞生初期混乱且痛苦,但秩序稳定后,大部分参与者的命运将由早期的幸存者决定 [69][70] - 长期来看,Agent技术形态终将到来,可能以不同品牌、交互形态或由现有APP自身推出的形式出现 [64][66] 对用户的短期与长期建议 - 短期建议:不要将所有关键服务依赖于尚不成熟的Agent,可将其用于处理非敏感任务,避免提交敏感信息 [67] - 长期建议:鼓励用户积极尝试和参与早期生态建设,以塑造未来技术形态,而非被动接受既定结果 [68]