文章核心观点 - 2025年末,AI行业围绕终端入口的争夺战显著提速,焦点从云端大模型转向对手机等终端设备的直接操作与控制,旨在重构移动互联网的流量分发权和交互逻辑 [1] - 科技巨头通过不同技术路径(如开源模型、系统级嵌入)竞逐“AI超级入口”,竞争范围已从手机扩展至穿戴设备和原生App,试图把握下一代流量入口并可能引发行业格局变革 [1][5][6] 行业动态与竞争格局 - 行业竞争在2025年末突然提速,巨头们不约而同地将目光锁定在“Phone Use”(手机操作),目标是从被动问答升级为主动执行,重构移动互联网流量分发权和交互逻辑 [1] - AI超级入口的争夺是战略层面的生死之战,在移动互联网红利见顶的背景下,大模型厂商试图通过Agent技术将分散的App功能收敛到一个统一入口 [5] - 竞争已不仅限于手机,科技巨头正试探新的硬件形态以求弯道超车,例如AI眼镜,行业正押注下一代流量入口,可能颠覆手机的统治地位 [6][7] - 另一条竞争路径是将App本身进化为超级AI应用,例如阿里巴巴基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 主要参与者的战略与产品 - 智谱:于12月9日正式宣布开源其自主研发的AutoGLM模型,口号是“让每台手机都能成为AI手机” [1]。其战略是通过开源核心模型和Phone Use能力框架,降低行业门槛,旨在将相关能力变为行业可共同打磨的公共底座 [2] - 字节跳动(豆包):于12月1日发布豆包手机助手技术预览版,选择与手机厂商在操作系统层面进行深度合作的系统级嵌入路径 [1][2]。官方演示展示了“所见即可问”和“所言即可为”的能力,能完成查票订票、商品下单等任务 [2]。公司明确表示目前没有自行开发手机的计划,而是选择生态共建 [3] - 小米:于今年6月推出售价1999元的AI眼镜,雷军将其定义为随身AI入口,试图通过摄像头和语音交互成为连接人与数字世界的轻量化中介 [6] - 阿里:旗下夸克于11月正式发布AI眼镜,试图将搜索场景从手机屏幕延伸至视觉场景 [6]。阿里在11月相继推出千问与灵光两大App,在AI to C领域,基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 技术发展现状与挑战 - 技术能力现状:大模型开始能够点击手机屏幕、理解UI并执行任务,但距离完美仍有很长的路要走 [1][3]。智谱指出,行业希望Agent能完成数十分钟甚至数小时的长距离任务,但当前模型仍难以充分实现这一目标 [3]。豆包团队也提示,受限于大模型技术的不确定性,相关场景无法保证百分百复现,产品实际可用性与预期有差距 [3] - 核心挑战(智商瓶颈):智谱认为最大的问题在于模型本身的“智商”,需要算法和模型公司的持续努力 [3] - 工程与应用挑战:如何为AI手机提供所需的操作系统和产品,以及建立Agent身份认证,需要行业共同协作 [3] 安全、隐私与部署模式 - 安全与隐私挑战:当AI具备操作微信、支付软件等权限时,如何防止其随意操作是悬在行业头顶的达摩克利斯之剑 [3]。用户隐私是行业共同的关注点 [3] - 部署模式趋势:出于对用户隐私、响应及时程度和云端使用成本等因素的考虑,轻量化本地部署是手机大模型的一个重要趋势 [3]。这意味着大模型将直接部署到手机内,并由手机芯片承担模型推理工作,这需要使用更少的数据量和计算资源 [4] - 智谱的安全策略:采取了较为保守的云手机与强隔离策略,在算法和工程开发早期就融入了敏感操作和安全栅栏的设计理念,将可控性和隐私放在最优先位置考虑 [5] 对产业链的影响与未来展望 - 对手机厂商的影响:AI技术可能带来一轮新的换机潮,但也可能让手机沦为大模型的躯壳 [6]。与国内领先的大模型厂商相比,手机厂商在算力基础设施上的储备往往不够充足,研发常遇算力受限,且投入巨大并面临技术挑战 [6] - 流量与生态变化:智谱提出了“Agent流量”的概念,即由Agent自主执行带来的流量,为移动互联网注入新流量 [5]。Agent带来的生产力改变和更好的个性化服务能力,被认为是对整个生态的新流量和红利注入 [6] - 商业利益与开放问题:当AI Agent成为超级入口,可能改写App开屏广告、推荐流广告的价值。但在商业利益分配机制理顺之前,拥有海量数据的头部App(如微信、美团、抖音等)是否愿意向Agent开放核心接口或数据,仍是巨大问号 [8] - 未来合作与参与方式:智谱表示希望看到更多Agent应用、AI原生手机及硬件问世,未来的参与方式将是多种多样且超出当前想象的 [6]
大模型开始“点击”屏幕!智谱、字节抢滩“手机操作”,AI超级入口争夺战升级
每日经济新闻·2025-12-10 22:52