Workflow
端侧智能体
icon
搜索文档
详解智能体2.0:手机里的“互联互通”新战场
21世纪经济报道· 2026-02-27 07:12
行业叙事与市场动态 - AI行业的叙事焦点正从宽泛的“智能体”收束到更具体的“端侧智能体”,其运行在手机、电脑和汽车等个人设备上,旨在重组用户与设备、App的连接方式 [1] - 字节跳动通过将豆包嵌入手机(豆包手机助手)引领了端侧智能体的破圈,其工程版样机在二手市场价格居高不下,并计划于2026年Q2发布正式版新机 [1][22] - 国内手机厂商已进行了一轮市场铺陈,据Quest Mobile 2025年9月测算,六家手机厂商的智能体用户规模在一年内合计增长6500万,整体达到5.35亿 [4] 产品性能与技术现状 - 当前手机智能体的整体实用性较低,在一项针对7款产品的70次任务测试中,整体成功率仅有两成,39%的任务启动后中断,24%直接失败降级为信息问答 [4] - 手机智能体的“接管能力”存在退化迹象,例如在点外卖等任务中,大多只能完成打开App的第一步,缺乏后续的深度操作能力 [5] - 多数智能体在任务规划上存在短板,例如无法将“找一款性价比高的抽纸”这类指令分解为“搜索抽纸”和“按价格筛选”的步骤,而是原封不动复制指令或仅用文字回答 [5] - 复旦大学专家指出,跨App任务是手机智能体能力的分水岭,当前只有豆包手机助手的成功率较高 [5] - 西湖大学专家认为,目前手机智能体整体仍停留在L1到L2阶段之间,只能在有限场景中演示,豆包手机助手意味着“智能体第一次真正产品化”,但尚不成熟 [6] 系统权限与安全风险 - 几乎所有被测评的手机预装智能体申请的权限总量都超过100项,这是一个惊人的数量级,远超微信等超级App [9] - 手机智能体申请的高敏感权限平均占比接近40%,包括获取精确定位、读取短信与录音、静默安装应用等,而普通App通常将此类权限占比控制在30%以下 [9][10] - 实现智能体核心能力(读屏与自动操作)的技术路径存在差异和风险:荣耀、小米、vivo主要依赖无障碍权限;豆包和OPPO则利用了更底层的系统服务(如WindowManagerService),后者能直接获取像素级屏幕内容并截取Secure安全窗口,但仅对厂商级预装应用开放 [11][12] - 在自动操作层面,豆包和荣耀申请了inject_events权限,该权限相当于设备的完全控制权,能力远超无障碍权限,同样只对厂商级应用开放 [13] - 系统方手机厂商在权限管理上兼具“玩家”和“裁判员”双重身份,测评发现存在原生智能体调用无障碍权限未提示或任务结束后权限未关闭等未严格遵循安全规则的情况 [13] 数据安全与隐私保护 - 所有手机智能体均采用“端云协同模式”处理数据,数据安全是整个手机安全体系中最核心、最脆弱的问题 [17] - 黑盒测试发现,当要求智能体处理屏幕上的身份证照片时,所有智能体都能完成任务且身份证号未被脱敏,意味着敏感信息大概率被上传至云端 [17] - 现有GUI Agent的隐私识别能力很弱,北京师范大学论文指出其只有13.3%的概率准确识别出安卓屏幕里的隐私信息 [17] - 在安全设计上,豆包、荣耀、OPPO已发布AI隐私与安全白皮书,当前措施集中在知情与控制、操作透明度、数据传输策略三个维度 [16] - 在知情控制方面,仅小米和豆包在实际操作前会单独弹窗询问“是否允许AI接管手机”;在操作留痕方面,小米和华为的基础记录存在缺失,例如调用麦克风后系统权限记录中无痕迹 [16] 商业博弈与生态合作 - 手机智能体的发展遭遇了来自App厂商的显性阻力,例如豆包手机发售后,微信曾将部分用户强制下线,触发了安全风控 [18] - App厂商的防御动机包括:可能影响平台安全运行;担心智能体替代真人操作会冲击用户活跃度、使用时长、广告曝光等核心商业指标;长期可能导致App被管道化 [19] - 手机厂商对与外部AI公司合作持谨慎态度,字节跳动曾接触中兴等厂商,提出由豆包接管手机AI助手入口并承担相关成本,但除中兴外未打动其他主流厂商,因该方案不符合手机厂商自身的AI战略,且产品稳定性是其更优先的考量 [20][21] - 行业正在探索“双轨并行”的落地路线:高频、标准化场景通过A2A等合作协议(API调用)完成;非标准化长尾场景再用GUI Agent的视觉识别路线,但合作缺乏先例和成熟标准,需解决流量分成、数据回流等核心问题 [23] - 部分App与字节跳动已达成停火协议,例如阿里系App允许努比亚设备正常登录,豆包则主动限制AI操作场景 [1][23] - 在进一步合作意愿上,阿里系因自身推进智能体战略可能更愿意探索;腾讯系(尤其是微信生态)则一直是坚定的防守阵营 [24]
万字详解智能体2.0:手机里的“互联互通”新战场
21世纪经济报道· 2026-02-24 08:10
行业趋势与市场格局 - 智能体行业的叙事焦点正从通用智能体转向更具体的**端侧智能体**,即部署在手机、电脑、汽车等个人设备上,能操作本地环境和工具的智能体 [1] - 行业共识认为,未来智能体的壁垒在于**能打通多少个人设备、互联多少服务**,其目标是成为新的能力层,重组用户与设备、App的连接方式,改变行业生态格局 [2] - 端侧智能体正从云端落入个人终端,国内手机厂商已完成一轮市场铺陈,根据Quest Mobile在2025年9月的测算,国内六家手机厂商的智能体用户规模在一年内合计**增长6500万**,整体用户规模达到**5.35亿** [3] - 在手机厂商中,OPPO、vivo、荣耀是积极发力者,2025年6月,**OPPO小布助手月活用户达1.6亿**,**vivo蓝心小v为5500万**,**荣耀YOYO助理为4200万**,三者跻身上半年增速最快的AI应用行列 [3] - “AI即操作系统”是主流手机厂商的战略想法,例如vivo基于蓝心大模型重构OriginOS 5,OPPO提出AI OS战略并为智能体配置独立物理唤醒键 [5] 产品性能与技术现状 - 手机智能体的实际体验与宣传存在落差,在一项针对7款手机智能体的总计70次任务的新一轮测试中,**整体成功率仅有两成**,**39%的任务启动后中断**,**24%直接失败降级为信息问答** [5] - 手机智能体的“接管能力”甚至出现退化,例如在点外卖任务中,多数智能体只能完成打开App的第一步,无法进行后续搜索、筛选和下单操作 [7] - 任务规划和App版本更新是当前主要技术短板,智能体常将用户指令原封不动复制进搜索框,而非进行逻辑分解;同时难以适应App名称变更等更新 [7] - 根据专家划分,手机智能体能力分为三档:基础能力(识别屏幕、调节系统设置)已普及;进阶能力各有所长;真正拉开差距的是**深度操作App的高阶能力**,目前仅豆包手机助手在此类跨App任务中成功率较高 [8] - 目前手机智能体整体仍停留在**L1到L2阶段**,只能在有限场景和App中进行演示,豆包手机助手被视为“智能体第一次真正产品化”,但如同第一辆在园区内测试的全自动驾驶汽车,尚未能开上公共道路 [8] - 除了操作App,**记忆功能**是另一条被押注的方向,豆包、vivo、OPPO已上线“闪记”类功能,目标是让AI理解模糊指令,更加“个人化”,厂商预计未来1~2年内用户体验将有巨大变化 [9] 技术路径与模型能力 - 几乎所有手机智能体都采用**GUI Agent(视觉路线)** 为底层模型,其工作流程为理解、感知、执行三步 [9] - 豆包手机助手采用未公开的闭源版模型,其技术基础可追溯至字节与清华大学联合推出的开源UI-TARS原生智能体,后续版本强调需通过SDK接入外部系统以突破纯GUI操作的局限 [10] - 国内不少手机智能体的基模来自**阿里通义实验室的Qwen系列**,该实验室后续发布了专用于GUI自动化任务的GUI-Owl模型和集成多种能力的MAI-UI模型 [10] - 在Android World基准测试(覆盖20个安卓应用、116项任务)中,**字节得分73.7分**,**阿里得分76.7分**,智谱、阶跃星辰和OPPO的自评分数在70到80分之间,但仍**未稳定达到人类平均水准(80分)**,该榜单最高分为一家美国硅谷初创公司获得的97.4分 [11] - 智谱开源的AutoGLM据披露在常见国内App中的任务成功率可达**89.7%** [14] - 学术指标与产业目标存在差距,许多落地障碍是工程问题,如多轮对话中的信息补充、上下文记忆、以及真实场景中不可预测的干扰(如广告弹窗) [15] 系统权限与安全风险 - 手机智能体需要极高系统权限,测评发现几乎所有预装智能体的**权限总量都超过100个**,远超微信等超级App [17] - 其中,**高敏感权限平均占比接近40%**,包括获取精确定位、读取短信与录音、静默安装应用等,而普通App的高敏感权限占比通常控制在30%以下 [17] - 智能体通过**读屏与自动操作**两项核心能力接管手机,实现技术路径存在差异:为读屏,荣耀、小米、vivo主要用无障碍权限;豆包和OPPO则利用更底层的系统服务(如WindowManagerService),后者能直接获取像素级屏幕内容并截屏Secure安全窗口 [20] - 在自动操作层面,豆包和荣耀申请了**inject_events权限**,该权限相当于设备的完全控制权,能力远超无障碍权限,且只对厂商级预装应用开放 [21][22] - 高权限带来巨大安全风险,智能体在截屏、分析、数据上云过程中不可避免接触敏感信息,隐私暴露风险客观存在,同时存在误操作风险 [23] - 数据上云是核心争议环节,测试显示除了系统原生功能外,大多数任务都会触发云端传输,且黑盒测试表明敏感信息(如未脱敏的身份证号)大概率被上传至云端处理 [27][28] - 现有GUI Agent的隐私识别能力很弱,一篇论文指出其只有**13.3%的概率**准确识别出安卓屏幕里的隐私信息,离合格的数据保护还很远 [28] 商业博弈与生态冲突 - 豆包手机助手发售次日,即遭遇**微信强制下线用户账号**,随后阿里系、美团系等App集体“限制”了豆包操作,导致来自努比亚设备的账号无法正常登录,核心卖点塌缩 [29] - App厂商的防御动机包括可能影响平台安全运行,以及担忧智能体完全替代真人操作会冲击活跃度、使用时长、广告曝光等核心商业指标,长期可能导致App被管道化(OTT化) [30] - 第三方智能体(如豆包、智谱、阶跃星辰)要上路,必须与手机厂商谈拢系统权限,字节跳动曾向手机厂商提出以免除托管费、承担Token成本等条件换取入口和流量,但除中兴外未打动其他厂商 [31] - 手机厂商拒绝的深层原因在于,字节的方案不符合其自身AI战略,主流厂商都有自己的AI团队,不愿让渡系统AI助手这一核心入口,且将产品稳定性置于AI创新之上 [32] - 行业正在探索“双轨并行”的落地路线:高频、标准化场景通过**A2A等合作协议**完成;非标准化的长尾场景再用GUI Agent的视觉识别路线 [33] - 部分App与字节跳动已达成停火协议,例如阿里系App允许努比亚设备正常登录,而豆包主动限制AI操作相关App,双方回到“井水不犯河水”状态 [35] - 腾讯系仍是坚定的防守阵营,对接入Agent尤其谨慎;而阿里系因自身推进智能体战略,可能更愿意探索合作 [35] 合规框架与未来挑战 - 围绕平台边界的争议,合规从业者认为应以“**互操作性**”为概念锚点,让各方在同一法律框架下对话 [36] - 欧盟已针对谷歌启动互操作性程序,要求其履行DMA义务,向第三方AI提供与Gemini同等的系统访问权,并为第三方搜索引擎提供FRAND(公平、合理和非歧视)条款 [37] - 一种理想化的参考方案是苹果的生态模式,通过App Intents框架,Siri只调度开发者授权的功能接口,并通过“阅后即焚”的私有云处理保护数据,但这建立在自研芯片和绝对生态霸主基础上,难以复制 [38] - 端侧智能体落地面临硬件工程挑战,复杂AI模型在手机上运行会导致能力降低、耗电快、发热、内存不足等问题 [39] - 当前矛盾在于,似乎没有一家公司同时具备硬件供应链、隐私技术与生态号召力,去引领安全方案与商业步伐 [39]
科技观察:“端侧智能体”将走向何方
环球时报· 2026-02-13 07:03
文章核心观点 - 端侧智能体(搭载于手机、电脑等终端设备并能独立执行任务的AI应用系统)正从概念走向实际应用,标志着AI从“会说话”向“会做事”演进的关键形态,2025年被业内视为“AI智能体元年” [1][2] - 当前端侧智能体发展存在GUI(图形用户界面)模拟操作和API(应用程序接口)协议授权两条主要技术路线,两者各有利弊,行业正探索结合路径 [4][5] - 以国内采用GUI路线的手机助手为代表的端侧智能体已改变智能手机应用交互范式,通过跨应用调用服务(如点外卖、订机票)快速验证用户需求并提升效率,但其长期发展依赖于安全可控、权限合规的技术机制构建 [6] - 端侧智能体的发展,特别是GUI路线,引发了关于用户权益、第三方数据隐私、网络安全以及责任边界等治理新挑战的广泛讨论 [7][8][10] - 专家普遍认为端侧智能体仍处于发展早期,未来形态可能超越当前手机助手,扩展到各类终端,其长期竞争力依赖于芯片、操作系统、大模型等核心领域的原始技术创新 [9][11] 技术路线分析 - **GUI(图形用户界面)路线**:通过视觉识别读取屏幕信息后进行“模拟操作”,优势在于无需与第三方应用逐一适配,部署灵活、适配广泛,具备较强的短期落地能力 [4] - **API(应用程序接口)协议授权路线**:通过标准化接口与目标App交互,已成为行业主流选择,优势在于安全性、可解释性与责任追溯方面更具优势,是构建可信协作体系的重要基础 [4][5] - **中美发展策略差异**:中国产业界普遍采取GUI模拟与API授权“双轨并行”的发展策略,以在创新速度与系统安全间实现动态平衡;美国主流企业在手机端较少采用GUI模拟路线,差异源于技术生态与制度环境的不同 [5] - **技术路线融合**:当前核心问题是如何将GUI与API两者结合,这需要技术逻辑上的创新与行业共识的共建,是端侧智能体发展的关键方向 [5] 市场应用与产品影响 - **改变交互范式**:采用GUI路线的手机助手可实现在一句话指令下跨应用调用服务(如点外卖、订机票、比价购物),显著改变了智能手机的应用交互范式,大幅缩短了从模型能力到用户价值的转化链路 [6] - **产品层面创新**:国内采用GUI路线的手机助手在理论、技术层面的创新有限,但在产品层面确实改变了用户使用手机的方式 [6] - **验证用户需求**:其价值在于快速验证用户需求、降低应用门槛、提升交互效率 [6] - **未来趋势**:从功能机到以App为主的智能手机,未来可能进化到AI直接穿透不同App完成功能,效率提升显著,用一个界面调度所有功能的趋势是存在的 [8] 发展挑战与风险关注 - **用户权益与知情权**:绝大部分用户不清楚自己具体授权了AI智能体什么权限,也不知道这些授权会带来什么后果 [8] - **第三方数据与隐私**:智能体为理解用户意图可能需要读取聊天记录等上下文,导致仅限于特定人知的第三方个人信息被获取,引发隐私保护问题 [8] - **安全与权限风险**:当AI智能体获取高敏系统级权限并模拟用户操作时,可能难以进行有效的安全防控和黑客攻击辨别,随着智能体向所有智能客户端和设备扩展,风险需要关注 [8] - **责任边界模糊**:在实现数据处理过程中,各相关方之间的权属边界以及权义分配尚不清晰,各主体对自身未来需承担责任的认知有限 [6] 治理与未来发展 - **治理新挑战**:智能体是“人工智能+”与千行百业深度融合的关口,使AI的各种潜在风险变为现实风险,AI治理的核心是权限让渡,需根据不同行业应用场景的容错率(如法律、金融要求99.9%准确率)来明确 [10] - **鸿沟与闭环风险**:不同人群使用AI的能力差异会带来新的数字鸿沟和财富重新分配问题;AI生成AI等决策闭环中无人参与,带来了与过去不同的新风险 [10] - **未来形态扩展**:端侧智能体的未来终端形态不限于智能手机,也可能是手环、眼镜等其他类型 [9] - **长期竞争力基础**:长期发展需更重视原始技术创新,如在芯片、操作系统、大模型能力迭代等核心领域不断进步,才能实现长期发展创新 [9] - **融合架构建议**:有利于行业持续发展的技术组合应以“场景适配、分层解耦、安全可控”为核心理念,在终端侧兼容多样化接入方式,在系统层统一权限管理与风险识别,在生态层加快API接口标准化 [11] - **标准与评估机制**:建议统筹推进安全评估与标准互操作双轨机制,完善GUI智能体安全评测体系,同时深化智能体通信协议国家标准研制,推动共建轻量级、可扩展的智能体支持层 [11]
豆包手机卷土重来:从“被围剿”,到“反围剿”丨智能涌现独家
36氪· 2026-01-29 13:10
豆包手机事件回顾与行业反应 - 腾讯公司马化腾在年会上罕见公开评价豆包手机,反对将用户手机屏幕传到云端,认为其“极其不安全、不负责任” [1] - 豆包手机方面迅速回应,承诺严格遵守用户授权,云端处理遵循“不存储、不训练”原则 [1] - 2025年12月,字节旗下豆包手机发布仅一天后,其AI Agent因触及各大超级APP的流量和核心数据,遭遇美团、微信、阿里系等互联网厂商的联合封锁,导致AI功能几近瘫痪 [1] 豆包手机第二代产品规划 - 字节已于2025年底开启豆包手机助手正式版项目,新机预计将于2026年Q2中晚期发布 [2] - 供应链人士称,公司对新机的预期比第一代测试版“大大提升” [2] - 第二代手机依旧与中兴努比亚合作,由中兴负责硬件,豆包负责AI [2] 应对“围剿”的策略与谈判进展 - 豆包手机团队正与多数主流应用厂商谈判,目前已与部分互联网公司(打车、外卖、订票等)谈好了部分常用权限 [3] - 公司并未放弃系统级GUI Agent路线,该路线通过获得操作系统高级权限,让AI看懂屏幕并模拟点击,以绕开应用接口授权难题 [3] - 行业人士分析,初代产品采用此路线是一种博弈策略,旨在为与互联网厂商谈判积累筹码 [3] 与手机厂商的合作模式 - 豆包手机正与一众手机厂商接洽合作,主要分为两类模式 [3] - 对于自研生态完善的手机大厂(如OPPO、vivo、荣耀),合作集中在技术层面,包括模型打通调用或合作“豆包输入法”等模块化产品 [3] - 这类厂商绝不可能让出核心入口,未来应用层将保留各自的语音助手(如小布同学、蓝心小V) [4] - 对于国内市占率较低、被归为“others”的厂商(如传音、魅族、联想),豆包采用更激进的策略,直接在其手机中内置豆包AI入口,类似于“赛力斯-华为”模式 [4] - 在商业模式上,手机厂商需要向字节支付技术授权费和AI服务订阅费 [5] 市场环境与“围剿”分析 - 端侧智能体厂商人士分析,豆包手机第一代被快速“围剿”的原因是用户量不大,且与努比亚特定机型强绑定,互联网厂商可针对机型进行“小范围定点狙击” [6] - 若豆包手机助手以软件形式进入大量手机,不与特定机型捆绑,且用户量提升,“围剿”将变得困难 [6] - 中国手机市场六大厂商(华为、小米、OPPO、vivo、苹果、荣耀)市占率高度接近,基本在15%上下浮动,大量“others”厂商共同瓜分最后5%的市场空间 [7] - 在内存暴涨、大盘下滑的背景下,长尾手机品牌生存处境艰难 [8] - 部分“others”厂商已公开表达合作意向,如魅族喊话“期待有机会深入合作”,联想杨元庆称硬件厂商和模型厂商是“互补关系” [8] 豆包在硬件领域的多形态布局 - 除了手机,豆包还在硬件形态上多重下注,2026年或将看到豆包眼镜、耳机等产品 [8] - 字节的眼镜团队是国内“规模最大的眼镜团队之一”,在北美设有研发团队,用于安置从Meta挖来的人才 [8] - 工业设计环节有三个团队参与,最终敲定两个构型方向:带显示的AI眼镜(预计2026年Q4发布)和不带显示的AI眼镜(预计2026年Q1发布) [8] - 新硬件的主要卖点是与豆包等字节成熟业务的协同,例如AI眼镜将主打全天候拍照,并主要面向豆包资深用户推出 [8] - 公司还在开发带摄像头的AI耳机项目 [9] - 行业人士分析,当前眼镜和耳机仍是手机的“附庸”,但AI手机将为其他品类带来想象空间,例如通过眼镜或耳机语音交互,解放双手 [9] 战略野心与行业竞争 - 豆包的野心并非单纯做手机,而是让带有豆包模型能力的Agent成为未来所有硬件的标准配置乃至入口 [9] - 当用户习惯更便捷的人机交互,由此形成的生态粘性比造出某一款硬件更有价值 [10] - 类似叙事也在海外发生,竞争对手谷歌正积极将Gemini模型下放到硬件设备,包括与苹果合作打造新Siri,以及应用于AI眼镜、具身智能机器人 [10] - 为布局海外,豆包手机近期也在与vivo等厂商协商,推动在其海外机型中搭载“豆包手机助手”,具体细节仍在谈判中 [10] 字节的核心优势与战略考量 - 公司在模型、人才、算力、数据等关键要素上已是国内“最顶配” [11] - 公司唯一缺少的是一个集中输出这些能力的硬件入口,而DAU破亿的豆包应用积累了大量中国用户数据和品牌效应,是一个合适的载体 [12] - 行业人士判断,在AI时代硬件终局尚未明确时,激进的字节完全可以同步探索多种可能性,并不计资源投入 [12]
剑指“AI时代的安卓”,千问抢滩AI硬件核心入口
第一财经资讯· 2026-01-11 20:57
AI硬件产业趋势与市场动态 - 2026年国际消费电子展(CES)核心议程转向“物理AI”,英伟达CEO黄仁勋称其“ChatGPT时刻”已然到来 [1] - AI硬件正从营销“噱头”蜕变为具备感知、理解与决策能力的“端侧智能体”,打造“AI落地的最后一公里” [3] - 2025年中国AI硬件市场(不含手机与汽车)规模将突破1.1万亿元,同比增长13.4%,未来五年将持续高速增长 [12] 阿里云通义千问的战略布局与生态构建 - 阿里云发布多模态交互开发套件,集成大语言、多模态、语音三款基础大模型,预置十多款Agent和MCP工具,应用于AI眼镜、学习机、陪伴玩具等硬件 [1] - 阿里云通义智能硬件展汇聚76+品类、200+品牌、1000+智能硬件,包括荣耀、OPPO、方程豹等大牌及新兴品牌,几乎所有产品基于千问模型打造 [6] - 阿里云通过“全尺寸、全模态开源”、“端云协同架构”、“软硬一体优化”等能力,为硬件企业提供低开发门槛平台,旨在扮演AI时代的“Android”角色 [7] - 多模态交互开发套件主动适配包括玄铁RISC-V在内的30多款主流终端芯片架构,满足绝大多数硬件设备的快速接入需求 [9] - 阿里云确定“有所为有所不为”的商业边界,专注于底层能力开发,以消除硬件厂商对“既做裁判又做运动员”的顾虑,共促生态繁荣 [12] AI硬件应用场景与产品创新 - AI宠物翻译器依托100多万宠物声音样本训练,结合通义千问大模型,实现94.6%的翻译准确率,从宠物发声到人类语言转化仅需1秒 [4] - 围绕AI硬件已发展起一个产业群,产品涵盖智能眼镜、耳机、水杯、手机壳、作业机、AI手机、AI陪伴玩具、AI网球陪练、AI私教等 [6] 阿里云对硬件厂商的赋能模式 - 收费模式从按Token(字数)转变为按License(硬件终端数量)收费,使硬件厂商易于核算成本,敢于大规模量产和定价 [10] - 通过多模态交互开发套件预置的Agent工具,厂商无需从零搭建服务后台即可快速上线付费订阅功能,阿里云智算算力保障服务稳定输出 [11] - 云端工程化优化使多模态交互开发套件端到端语音交互时延低至1秒,视频交互时延低至1.5秒,提升AI硬件响应能力 [10] - 赋能推动硬件厂商从“一次性卖外壳”转向“持续性卖服务”,获得更可持续的盈利模式,跳出价格战并转向高毛利服务领域 [10][11][12]
剑指“AI时代的安卓”,千问抢滩AI硬件核心入口
第一财经· 2026-01-11 20:54
AI硬件产业新变革 - 2026年AI正加速走向物理世界,国际消费电子展(CES)核心议程转向“物理AI”,其“ChatGPT时刻”已然到来[1] - AI硬件正从营销“噱头”蜕变为真正具备感知、理解与决策能力的“端侧智能体”,打造“AI落地的最后一公里”[3] - 市场对AI硬件的需求挖掘不断提升,新兴场景被快速开发,大模型厂商加速入局争夺下一代智能入口[8] - 在阿里云通义智能硬件展上,共有76+品类、200+品牌、1000+智能硬件,几乎所有产品都基于千问模型打造[8] 千问的战略定位与赋能模式 - 阿里千问正瞄准AI硬件的“安卓时刻”,旨在通过提供低开发门槛、响应速度快、场景丰富的平台,抢占下一代智能流量入口[4][9] - 公司通过“全尺寸、全模态开源”、“端云协同架构”、“软硬一体优化”等能力,为硬件企业和解决方案商提供平台[9] - 合作模式上,公司选择向芯片、模组等产业链伙伴开放能力,由他们与下游企业合作,以应对产品形态碎片化的挑战[9][10] - 多模态交互开发套件主动适配包括玄铁RISC-V在内的30多款主流终端芯片架构,满足绝大多数硬件设备的快速接入需求[12] - 公司为硬件厂商建立起一套从底层芯片指令集到上层应用体验“全链路协同优化”的解决方案[12] 技术能力与性能提升 - 依托通义千问大模型的多模态语义理解与边缘计算,宠物翻译器能够实现94.6%的超高翻译准确率,从宠物发声到人类语言转化仅需1秒[6] - 阿里云多模态交互开发套件端到端语音交互时延低至1秒,视频交互时延低至1.5秒,提升了AI硬件的响应速度与能力[15] - 无论是功耗以毫瓦计的智能戒指,还是算力冗余的智能汽车座舱,厂商都能在千问找到成本与性能的最优解[12] 商业模式创新与行业影响 - 阿里云将硬件厂商的盈利模式从“一次性卖外壳”转向“持续性卖服务”,帮助厂商获得更可持续的盈利模式[14] - 多模态交互开发套件收费模式从按Token(字数)转变为按License(硬件终端数量)收费,让硬件厂商敢于大规模量产和定价[15] - 公司通过预置Agent工具和提供智算算力,为硬件厂商提供“技术+运营”的双重赋能,使其得以转向高毛利的服务领域,破解行业毛利困局[15] - 公司确定了“有所为有所不为”的商业边界,专注于底层能力开发,以消除硬件厂商对“既做裁判又做运动员”的顾虑,与行业共同将蛋糕做大[16] 市场前景与行业趋势 - 根据洛图科技数据,2025年中国AI硬件市场(不含手机与汽车)规模将突破1.1万亿元,同比增长13.4%,并将在未来五年持续高速增长[16] - 在义乌小商城和华强北等地,围绕AI硬件已发展起一个庞大的产业群,产品涵盖智能眼镜、耳机、水杯、手机壳、作业机、AI手机、AI陪伴玩具等[8] - 巨头通过将智能注入万千设备,正推动AI深入物理世界的核心进程,一个万亿级的新赛道正全新开启[16]
黄仁勋:物理AI走进现实世界,拼的不单是算力
聪明投资者· 2026-01-11 10:06
拉斯维加斯消费电子展(CES)观察 - 本周重点关注拉斯维加斯消费电子展(CES)上展示的众多黑科技,其展示成果令人震撼[1] - 展会最受瞩目的焦点是英伟达首席执行官黄仁勋的主讲,其核心观点是“物理AI”时代正在加速到来[1] - 黄仁勋在主讲后还进行了多场富有个性的线下交流活动[2] 英伟达首席执行官黄仁勋的核心观点 - 黄仁勋在CES 2026的演讲中重点阐述了三个关键话题,并展示了一台“芯片怪兽”[3] - 演讲后的问答环节涉及多个重要议题,包括关键临界点、公司护城河、对埃隆·马斯克的看法以及亿万富翁税等[3] 其他值得关注的市场观点与投资策略 - 有观点指出,市场开年重返4000点,知名私募机构形成了慢牛共识,投资策略应聚焦于挖掘“不拥挤的成长”领域并抓住仍然存在的“低垂的果实”[3] - 段永平2025年的分享精华指出,当前世界已有所不同,投资最重要的是买入好公司,同时每个人都需认真了解和学习人工智能(AI)[3] - 刘煜辉提出,在“G2竞争”的时代背景下,应重视端侧智能体、黄金以及有色金属板块可能出现的重大贝塔行情[3] - 达利欧对2025年进行复盘,认为关键变量在于货币,并预计美国股市的长期回报率可能仅为4.7%[3]