直击WAIC2025|手机Agent竞赛升级:荣耀发布多模态感知大模型MagicGUI,从单智能体任务执行到多智能体协同
每日经济新闻·2025-07-26 17:47
AI手机发展趋势 - AI手机不应仅满足于翻译、文档处理等简单功能,而应结合AI"智慧"与手机便捷特性拓展更广阔应用场景[1] - 主流手机厂商共识:语音助手将从"鸡肋时代"转向具备感知、推理、决策、操作能力的"轻量级智能体"[2] - 安卓阵营AI助手实用性显著领先苹果,荣耀、vivo、小米等已实现从聊天机器人到任务型智能体的进化[6] 荣耀MagicGUI大模型技术突破 - 荣耀发布70亿参数规模MagicGUI大模型并开源,支持跨应用协同完成任务(如打车场景多步操作)[1] - 模型实现从单智能体任务执行到多智能体协同升级,可调度设计、排版、支付等专项模块完成复杂指令[7] - 采用两阶段训练范式(CPT+RFT)提升屏幕感知与泛化能力,支持根据视觉反馈动态调整操作[9] 行业技术变革 - 交互主体从App转向Agent,GUI Agent技术通过多模态视觉模型实现任务自动化(如点击、输入等)[8] - 技术挑战包括应用多样性(Google Play达168万个应用)和界面频繁变动导致的执行不确定性[8] - 对比苹果Siri功能停滞,安卓厂商已实现点咖啡、订餐厅、发红包等深度任务集成[6] 厂商竞争格局 - 荣耀YOYO智能体通过MagicGUI实现多智能体协同,显著优于单智能体的任务局限性[7] - vivo"蓝心小V"、小米"超级小爱"等竞品同样具备复杂任务执行能力,但未实现多智能体调度[2][6] - 苹果在AI功能落地进度落后,国行iPhone 15Pro/16系列仍无法使用基础AI指令[6]