小米小爱同学
搜索文档
万字详解智能体2.0:手机里的“互联互通”新战场
21世纪经济报道· 2026-02-24 08:10
行业趋势与市场格局 - 智能体行业的叙事焦点正从通用智能体转向更具体的**端侧智能体**,即部署在手机、电脑、汽车等个人设备上,能操作本地环境和工具的智能体 [1] - 行业共识认为,未来智能体的壁垒在于**能打通多少个人设备、互联多少服务**,其目标是成为新的能力层,重组用户与设备、App的连接方式,改变行业生态格局 [2] - 端侧智能体正从云端落入个人终端,国内手机厂商已完成一轮市场铺陈,根据Quest Mobile在2025年9月的测算,国内六家手机厂商的智能体用户规模在一年内合计**增长6500万**,整体用户规模达到**5.35亿** [3] - 在手机厂商中,OPPO、vivo、荣耀是积极发力者,2025年6月,**OPPO小布助手月活用户达1.6亿**,**vivo蓝心小v为5500万**,**荣耀YOYO助理为4200万**,三者跻身上半年增速最快的AI应用行列 [3] - “AI即操作系统”是主流手机厂商的战略想法,例如vivo基于蓝心大模型重构OriginOS 5,OPPO提出AI OS战略并为智能体配置独立物理唤醒键 [5] 产品性能与技术现状 - 手机智能体的实际体验与宣传存在落差,在一项针对7款手机智能体的总计70次任务的新一轮测试中,**整体成功率仅有两成**,**39%的任务启动后中断**,**24%直接失败降级为信息问答** [5] - 手机智能体的“接管能力”甚至出现退化,例如在点外卖任务中,多数智能体只能完成打开App的第一步,无法进行后续搜索、筛选和下单操作 [7] - 任务规划和App版本更新是当前主要技术短板,智能体常将用户指令原封不动复制进搜索框,而非进行逻辑分解;同时难以适应App名称变更等更新 [7] - 根据专家划分,手机智能体能力分为三档:基础能力(识别屏幕、调节系统设置)已普及;进阶能力各有所长;真正拉开差距的是**深度操作App的高阶能力**,目前仅豆包手机助手在此类跨App任务中成功率较高 [8] - 目前手机智能体整体仍停留在**L1到L2阶段**,只能在有限场景和App中进行演示,豆包手机助手被视为“智能体第一次真正产品化”,但如同第一辆在园区内测试的全自动驾驶汽车,尚未能开上公共道路 [8] - 除了操作App,**记忆功能**是另一条被押注的方向,豆包、vivo、OPPO已上线“闪记”类功能,目标是让AI理解模糊指令,更加“个人化”,厂商预计未来1~2年内用户体验将有巨大变化 [9] 技术路径与模型能力 - 几乎所有手机智能体都采用**GUI Agent(视觉路线)** 为底层模型,其工作流程为理解、感知、执行三步 [9] - 豆包手机助手采用未公开的闭源版模型,其技术基础可追溯至字节与清华大学联合推出的开源UI-TARS原生智能体,后续版本强调需通过SDK接入外部系统以突破纯GUI操作的局限 [10] - 国内不少手机智能体的基模来自**阿里通义实验室的Qwen系列**,该实验室后续发布了专用于GUI自动化任务的GUI-Owl模型和集成多种能力的MAI-UI模型 [10] - 在Android World基准测试(覆盖20个安卓应用、116项任务)中,**字节得分73.7分**,**阿里得分76.7分**,智谱、阶跃星辰和OPPO的自评分数在70到80分之间,但仍**未稳定达到人类平均水准(80分)**,该榜单最高分为一家美国硅谷初创公司获得的97.4分 [11] - 智谱开源的AutoGLM据披露在常见国内App中的任务成功率可达**89.7%** [14] - 学术指标与产业目标存在差距,许多落地障碍是工程问题,如多轮对话中的信息补充、上下文记忆、以及真实场景中不可预测的干扰(如广告弹窗) [15] 系统权限与安全风险 - 手机智能体需要极高系统权限,测评发现几乎所有预装智能体的**权限总量都超过100个**,远超微信等超级App [17] - 其中,**高敏感权限平均占比接近40%**,包括获取精确定位、读取短信与录音、静默安装应用等,而普通App的高敏感权限占比通常控制在30%以下 [17] - 智能体通过**读屏与自动操作**两项核心能力接管手机,实现技术路径存在差异:为读屏,荣耀、小米、vivo主要用无障碍权限;豆包和OPPO则利用更底层的系统服务(如WindowManagerService),后者能直接获取像素级屏幕内容并截屏Secure安全窗口 [20] - 在自动操作层面,豆包和荣耀申请了**inject_events权限**,该权限相当于设备的完全控制权,能力远超无障碍权限,且只对厂商级预装应用开放 [21][22] - 高权限带来巨大安全风险,智能体在截屏、分析、数据上云过程中不可避免接触敏感信息,隐私暴露风险客观存在,同时存在误操作风险 [23] - 数据上云是核心争议环节,测试显示除了系统原生功能外,大多数任务都会触发云端传输,且黑盒测试表明敏感信息(如未脱敏的身份证号)大概率被上传至云端处理 [27][28] - 现有GUI Agent的隐私识别能力很弱,一篇论文指出其只有**13.3%的概率**准确识别出安卓屏幕里的隐私信息,离合格的数据保护还很远 [28] 商业博弈与生态冲突 - 豆包手机助手发售次日,即遭遇**微信强制下线用户账号**,随后阿里系、美团系等App集体“限制”了豆包操作,导致来自努比亚设备的账号无法正常登录,核心卖点塌缩 [29] - App厂商的防御动机包括可能影响平台安全运行,以及担忧智能体完全替代真人操作会冲击活跃度、使用时长、广告曝光等核心商业指标,长期可能导致App被管道化(OTT化) [30] - 第三方智能体(如豆包、智谱、阶跃星辰)要上路,必须与手机厂商谈拢系统权限,字节跳动曾向手机厂商提出以免除托管费、承担Token成本等条件换取入口和流量,但除中兴外未打动其他厂商 [31] - 手机厂商拒绝的深层原因在于,字节的方案不符合其自身AI战略,主流厂商都有自己的AI团队,不愿让渡系统AI助手这一核心入口,且将产品稳定性置于AI创新之上 [32] - 行业正在探索“双轨并行”的落地路线:高频、标准化场景通过**A2A等合作协议**完成;非标准化的长尾场景再用GUI Agent的视觉识别路线 [33] - 部分App与字节跳动已达成停火协议,例如阿里系App允许努比亚设备正常登录,而豆包主动限制AI操作相关App,双方回到“井水不犯河水”状态 [35] - 腾讯系仍是坚定的防守阵营,对接入Agent尤其谨慎;而阿里系因自身推进智能体战略,可能更愿意探索合作 [35] 合规框架与未来挑战 - 围绕平台边界的争议,合规从业者认为应以“**互操作性**”为概念锚点,让各方在同一法律框架下对话 [36] - 欧盟已针对谷歌启动互操作性程序,要求其履行DMA义务,向第三方AI提供与Gemini同等的系统访问权,并为第三方搜索引擎提供FRAND(公平、合理和非歧视)条款 [37] - 一种理想化的参考方案是苹果的生态模式,通过App Intents框架,Siri只调度开发者授权的功能接口,并通过“阅后即焚”的私有云处理保护数据,但这建立在自研芯片和绝对生态霸主基础上,难以复制 [38] - 端侧智能体落地面临硬件工程挑战,复杂AI模型在手机上运行会导致能力降低、耗电快、发热、内存不足等问题 [39] - 当前矛盾在于,似乎没有一家公司同时具备硬件供应链、隐私技术与生态号召力,去引领安全方案与商业步伐 [39]
苹果低下了高傲的头颅
创业邦· 2026-01-19 09:13
文章核心观点 - 苹果与谷歌的合作是一次基于各自战略需求的精准互撩,苹果以每年10亿美元的费用换取谷歌Gemini模型和云技术的使用权,旨在快速提升Siri的AI能力并争取自研时间,而谷歌则借此获得进入苹果高质量生态的入口,以加速其AI模型的优化与市场扩张[6] - 此次合作标志着AI行业竞争重点从单一模型性能比拼转向生态绑定能力的较量,可能重塑行业格局,对OpenAI等竞争对手构成压力[21] - 合作本质上是临时同盟,双方均存在战略保留,苹果意在为自研争取时间并防止对单一供应商形成依赖,未来可能根据自身技术进展调整合作深度[6][24] 苹果的AI困境与战略考量 - **市场与竞争压力**:全球AI手机渗透率预计将从2023年的5%飙升至2027年的54%,而苹果在此浪潮中明显落后[8];Siri用户满意度在2025年第四季度仅为62%,较2023年下降15%,且在“用户最想更换的智能助手”投票中以42%占比高居榜首[10];AI能力不足已影响iPhone销量,2025财年全球智能手机市场份额同比下降2.1%,“AI功能未能满足用户需求”被列为核心原因之一[10] - **技术与人才短板**:苹果自研的最大参数模型仅1500亿,MMLU基准测试成绩78.6%,未达行业第一梯队门槛[8];2024-2025年间,AI团队17名核心成员跳槽至Meta、OpenAI等公司,导致研发进度滞后18个月[8] - **务实选择与风险转移**:自建能支撑1万亿参数模型的AI基础设施需耗资480亿美元且至少需3年,苹果选择以每年10亿美元“租金”方式与谷歌合作,是一次经典的风险转移[10][14];苹果的基因是消费电子和端侧计算,其严格的隐私政策在大模型训练时代成为枷锁,“租”成为最现实的选择[11] - **合作预期收益**:搭载Gemini的新版Siri预计于2026年春季随iOS 26.4推送,支持128K超长文本处理等功能,复杂指令处理速度提升30%以上,响应时间压缩至0.5秒以内[13];预计将带动该系列iPhone销量同比增长11%,季度利润接近400亿美元[13];AI功能升级将提升生态粘性,2025年调研显示65%的苹果用户因“生态协同体验”而继续使用iPhone[13] - **长期自研规划**:借助合作获得的缓冲期,苹果规划在2027年推出1万亿参数的云端模型,目标是在MMLU测试中突破92%的准确率,超越当前Gemini水平[13];内部芯片团队仍在研发下一代NPU,目标是将本地运行模型参数量提升到150亿至200亿级别[24] 谷歌的战略扩张与收益 - **生态入口与高质量数据**:谷歌AI战略的核心难点在于生态入口不足,需要海量真实场景数据优化模型[15];苹果全球超20亿台活跃设备中,iPhone用户占比65%,具备高消费能力、高粘性、高交互频率特点[15];iPhone用户平均每天使用语音助手4.2次,是Android用户的1.8倍,AI功能付费意愿达23%,远高于行业平均的8%[16];接入苹果生态相当于获得13亿高质量测试用户[16] - **市场地位与能力提升**:通过此次合作,Gemini将从“云端工具”转型为13亿iPhone用户的“默认AI引擎”,实现从“需要用户主动打开”到“被动唤醒即可使用”的场景渗透[18];预计到2026年底,Gemini月活跃用户将突破5亿,市场份额提升至25%以上[18];借助iPhone用户数据优化后,Gemini方言识别准确率预计提升15%,复杂指令处理效率提升20%,MMLU测试准确率有望突破95%[18] - **构建全场景生态优势**:Gemini已为三星Galaxy AI提供支撑,覆盖约10亿Android用户,加上iPhone的13亿用户,将形成碾压级优势[20];未来,Gemini可能成为硬件厂商推出AI功能的“首选合作伙伴”,并可将经验复制到智能汽车、智能家居等领域,目标是成为全场景的底层大脑,重新确立垄断地位[20] 行业格局与竞争影响 - **竞争范式转变**:此次合作标志着AI行业从“单一模型性能比拼”转向“生态绑定能力较量”[21];绑定主流硬件生态成为占据主导地位的关键,只懂堆参数而无生态入口的公司可能沦为技术供应商[21] - **对OpenAI的冲击**:随着Gemini成为Siri核心驱动,OpenAI在苹果生态中的战略地位被削弱[21];2025年第四季度,ChatGPT周活跃用户增长已降至5%,若iPhone用户转向Gemini,OpenAI市场份额可能从60.5%下滑至50%以下[21];尽管OpenAI正加速推进新型AI硬件设备以构建独立入口,但难度巨大,可能影响其IPO估值[21] - **合作的非排他性与未来不确定性**:苹果强调与谷歌的合作并非排他性协议,用户仍可通过Siri调用ChatGPT,未来还可能接入其他大模型[23];苹果意在防止谷歌形成垄断性供给,并借合作验证AI场景为自研铺路[24];合作能否长期维持取决于苹果自研突破的时间,若需三年,谷歌有足够时间让Gemini成为AI时代的基础设施,届时苹果自研大模型的市场意义可能减弱[24]
AI手机给谁开了窗
北京商报· 2025-12-05 00:13
字节跳动与中兴通讯合作事件核心观点 - 字节跳动豆包大模型与中兴通讯旗下努比亚手机合作推出“豆包手机助手”工程样机 售价3499元人民币 产品迅速售罄并引发二手市场超高溢价 资本市场反应热烈 中兴通讯A股当日涨停 总市值突破2100亿元人民币[1] - 此次合作是AI软件能力与硬件制造能力的闭环互补 字节跳动获得了深度绑定系统的硬件载体以落地大模型能力 中兴则借助豆包的流量与技术背书 实现了短期热度与市场关注度的双重提升[5] - 合作对业绩承压的中兴通讯而言是一个急需握紧的“纾困窗口” 公司2024年营收1212.99亿元人民币 同比下降2.38% 归母净利润84.25亿元人民币 同比下降9.66% 其中四季度归母净利润同比大跌65.08%[6] - 但合作窗口的存续时间可能有限 字节跳动方面明确没有自研手机计划 但正与多家手机厂商洽谈生态合作 意味着中兴并非唯一选择[1][7] 合作背景与双方动机 - **字节跳动的选择逻辑**:项目初期 字节跳动原计划将豆包大模型以系统级能力嵌入头部手机厂商产品 但华为、小米、OPPO、vivo、荣耀等头部品牌均在构建自有AI生态 生态壁垒导致外部AI助手难以深度嵌入[3] - **转向中小厂商**:根据IDC数据 2022至2024年间 vivo、华为、苹果等头部厂商长期占据近八成市场份额 但“其他”阵营份额从2022年的15.3%缓步爬升至2024年的20.8% 选择中小厂商既能规避生态封闭阻碍 也能以较低成本快速完成AI助手规模化试点[3] - **中兴通讯的契合点**:中兴长期处于头部品牌之外的第二梯队 缺乏破圈抓手 豆包带来的AI标签成为其摆脱同质化的切口 其硬件研发与调教能力能满足“操作系统层面合作”的技术门槛[4][5] 市场反应与产品定位 - **销售与溢价情况**:搭载豆包手机助手的努比亚M153手机在官方商城迅速售罄 据称仅为3万台的小批量发售[3] 二手市场溢价远超预期 全新未拆封机型报价一度飙升至9999元 相比3499元发售价溢价超过100%[4] - **产品定位对比**:该产品定价已比肩iPhone 17 Pro Max的9999元起售价 甚至超过华为Mate80 Pro Max顶配版的8999元定价 而中兴旗下旗舰努比亚Z80 Ultra发售价为4999元起[4] - **官方定位**:中兴官方客服表示该机“仅面向需要体验豆包手机助手的行业人士” 定位为“工程样机”[4] 对中兴通讯的潜在影响与挑战 - **短期积极影响**:合作带来的AI标签有助于打破品牌小众困局 带动用户圈层扩张 公司手机业务在2024年营收同比增长超40% 并布局了全系AI终端[7] - **长期竞争力构建路径**:专家分析需通过三点将短期红利转化为长期竞争力 一是深化通信与AI的定制融合以打造首发优势 二是强化品牌营销与渠道售后服务 三是将AI能力梯度延伸至全产品线 借爆款带动整体销量[8] - **面临的主要风险**:可替代性风险客观存在 若豆包与头部品牌合作 必定分流原本可能涌向中兴的部分用户 同时还需应对腾讯、阿里等软件平台的生态壁垒 以及小米、苹果、华为等在系统掌控与产品热度上的竞争[8] 行业趋势:AI成为手机存量市场竞争核心 - **市场背景**:中国智能手机市场进入存量竞争深水区 IDC数据显示2025年二季度出货量同比下降4% 三季度同比微降0.5%[10] - **合作模式的意义**:豆包手机助手从应用侧过渡到操作系统侧 通过系统级授权实现跨应用协同 为不具备自研大模型能力的中小厂商提供了快速切入AI赛道的路径[10] - **头部厂商的路径**:头部品牌大多选择“自研系统+AI能力”的整合路径 如华为鸿蒙OS开放智能体框架 荣耀推出自进化AI系统 小米HyperOS添加AI功能 共同特点是将AI能力与自身操作系统、硬件配置相结合形成闭环体验[11][12] - **竞争关键**:未来的市场竞争将是AI整合深度、场景适配广度与用户体验满意度的综合较量 关键在于让AI与系统、硬件形成有效协同 而非简单的功能堆砌[12]
商汤科技20250727
2025-07-28 09:42
纪要涉及的行业和公司 - **行业**:人工智能行业,涵盖大模型技术、机器人、金融、教育、航空等多个领域 - **公司**:商汤科技、英伟达、质谱公司、小米、金山办公、华为升腾、值得买科技、第四范式、科大讯飞、银河通用、库帕斯科技 纪要提到的核心观点和论据 大模型技术发展 - **技术范式转变**:大模型技术从预训练为主、监督学习为辅的范式逐渐转移到强化学习范式,提升了推理能力,但也带来幻觉、冗长思考等挑战[22] - **未来发展方向**:一是扩展当前范式以接受自然语言反馈,实现测试时群体交互;二是向自主在线代理方向发展,实现真正意义上的自主智能体[25] - **架构创新**:传统Transformer架构在算法向RL迁移时遇到阻碍,未来可能重新考虑RN类架构设计[28] 数据问题 - **数据枯竭**:互联网数据逐渐枯竭,需寻找新的数据来源和方法,以实现人工智能尤其是AGI方向上的进一步突破[30] - **数据不足解决方法**:使用物理模拟生成模拟场景训练模型,但需建立反馈机制,结合真实世界的基准测试和验证[31] - **行业数据重要性**:行业内有大量未被利用的数据,可通过行业场景大模型进行预训练激发出来[33] 人工智能可持续发展 - **挑战**:数据中心能耗巨大,预计到2030年全球数据中心将占总用电量的8%,推理阶段能耗可能成为主要来源[2][8] - **能效提升方法**:从基础设施、云、大模型以及应用层多层面优化,通过软件、硬件和制造工艺创新提升能效,也可进行能源优化[9] - **赋能可持续发展**:人工智能能够显著减少重工业碳排放,帮助工厂节能减排,推动整体能源消耗平衡并最终减少碳排放[11] 行业应用与商业化 - **金融领域**:大规模人工智能技术落地面临数据质量、安全和资源利用等挑战,需优化资源配置和改进数据处理方法[38] - **商汤科技成果**:通过SenseNova大模型及研发体系,推动高效率、低成本、规模化的AI创新和落地,在多模态技术、机器人、自动驾驶等领域有诸多应用[41] - **生产力转化**:实现从生产力工具到实际生产力的转化需要多模态融合分析和自动化处理,小浣熊产品是典型例子[49] - **人机交互**:大语言模型的发展推动人机交互进入新范式,AI从辅助角色转变为主动执行任务,人类进行监督和指导[51] 国际合作与发展 - **中印合作**:中印两国在人工智能领域的合作涵盖政府、工业、大学等多个层面,有助于解决AI治理核心问题,促进本地创新[17] - **中国举措**:中国通过开源贡献、提出愿景方案、建设合作中心等举措,推动全球人工智能发展[81] 其他重要但是可能被忽略的内容 - **香港国际机场应用**:香港国际机场在2020 - 2025年期间逐步引入多种人工智能应用,如自动化行李分拣系统、自主巡逻车等,以应对运营效率、安全等挑战[72] - **智能体发展**:智能体已成为大模型应用的重要关注点,其产业链逐渐形成,在多个领域得到广泛应用[78] - **具身智能**:2025年具身智能发展取得进展,但进入各行各业和家庭还需解决数据问题,合成数据与真实数据结合是有效策略[82] - **AI发展影响**:AI发展对人类工作、生活及独特性提出挑战,科学家应提前思考,确保具身智能与人类关系安全[89]