Consumer Electronics

搜索文档
直击WAIC2025|手机Agent竞赛升级:荣耀发布多模态感知大模型MagicGUI,从单智能体任务执行到多智能体协同
每日经济新闻· 2025-07-26 17:47
AI手机发展趋势 - AI手机不应仅满足于翻译、文档处理等简单功能,而应结合AI"智慧"与手机便捷特性拓展更广阔应用场景[1] - 主流手机厂商共识:语音助手将从"鸡肋时代"转向具备感知、推理、决策、操作能力的"轻量级智能体"[2] - 安卓阵营AI助手实用性显著领先苹果,荣耀、vivo、小米等已实现从聊天机器人到任务型智能体的进化[6] 荣耀MagicGUI大模型技术突破 - 荣耀发布70亿参数规模MagicGUI大模型并开源,支持跨应用协同完成任务(如打车场景多步操作)[1] - 模型实现从单智能体任务执行到多智能体协同升级,可调度设计、排版、支付等专项模块完成复杂指令[7] - 采用两阶段训练范式(CPT+RFT)提升屏幕感知与泛化能力,支持根据视觉反馈动态调整操作[9] 行业技术变革 - 交互主体从App转向Agent,GUI Agent技术通过多模态视觉模型实现任务自动化(如点击、输入等)[8] - 技术挑战包括应用多样性(Google Play达168万个应用)和界面频繁变动导致的执行不确定性[8] - 对比苹果Siri功能停滞,安卓厂商已实现点咖啡、订餐厅、发红包等深度任务集成[6] 厂商竞争格局 - 荣耀YOYO智能体通过MagicGUI实现多智能体协同,显著优于单智能体的任务局限性[7] - vivo"蓝心小V"、小米"超级小爱"等竞品同样具备复杂任务执行能力,但未实现多智能体调度[2][6] - 苹果在AI功能落地进度落后,国行iPhone 15Pro/16系列仍无法使用基础AI指令[6]
“看一下”即支付!阿里巴巴公布首款AI眼镜研发进展
证券时报· 2025-07-26 17:40
阿里巴巴AI眼镜技术进展 - 阿里巴巴在2025世界人工智能大会公布首款自研AI眼镜"夸克AI眼镜"已完成研发,预计年内发布 [1] - 产品深度融合阿里及支付宝生态,集成通义千问大模型、夸克AI能力,支持高德近眼导航、支付宝"看一下"支付、淘宝比价、飞猪商旅提醒等多场景功能 [1][4] - 硬件实现系统重构,具备通话、音乐、翻译、会议纪要等主流功能,并在AI交互、佩戴舒适度、显示与影像、续航等关键指标取得突破 [4] 产品战略定位 - 阿里巴巴智能信息事业群终端业务负责人宋刚表示,AI眼镜将成为下一代人机交互的"感官中枢",催生个人数据量爆发 [3][4] - 产品定位从"听歌拍摄"升级为随身AI超级助理,联合全球领先眼镜品牌通过C2M定制解决佩戴不适、续航短等行业痛点 [4] - 标志着公司AI to C战略从软件向多形态硬件延伸,是继通义千问大模型、夸克AI应用后的又一战略性布局 [1] 行业发展趋势 - 智能眼镜市场2023年上半年成交量同比激增10倍,品牌数量增长超3倍,产品均价从2000元降至1500元 [6] - 华为、百度、小米、苹果、OPPO等科技巨头及老凤祥等传统品牌加速入局,小米AI眼镜起售价1999元,老凤祥产品预计9月上市 [6] - 行业预计AR/AI眼镜将在2-3年内进入爆发期,5年内有望成为继手机、手表后的第三大智能终端 [6][7] 技术生态协同 - 研发团队联合高德地图开发近眼显示导航系统,支持骑行、步行等移动场景精准指引 [4] - 夸克视觉问答、学习办公能力原生适配,支付宝、淘宝、飞猪等阿里系应用深度整合 [4] - 光学、芯片及整机组装能力被视作产业链核心环节,技术突破将加速产品普及 [7]
荣耀发布MagicGUI大模型并开源 加速构建AI终端生态
央广网· 2025-07-26 17:04
产品发布 - 公司在世界人工智能大会期间正式发布自研多模态感知大模型MagicGUI 参数规模达7B(70亿) 支撑底层AI智能体的多模态感知与自动执行规划能力 达到行业领先水平 [1] - MagicGUI是公司首个GUI开源大模型 面向全球软硬件开发者开源 旨在助力构建更繁荣的AI生态 [1] 技术创新 - 独创"继续预训练+强化微调"两阶段训练方案 在常用场景用机操控中准确率达91.5% 较行业同类顶级开源模型提升16.4% [3] - 创新性引入多样化多模态训练数据 构建高效数据采集与构造框架 优化数据配比与筛选方案 形成高质量训练数据集 [4] - 采用空间增强复合奖励函数和DF-GRPO强化学习算法 提升模型数据利用效率与泛化能力 在未经训练的新场景中保持稳定性能 [4] - 在移动端视觉定位、页面理解问答、单步操作、动作序列拆解执行4类任务中跑分全面领先 [4] 应用落地 - 折叠屏旗舰Magic V5首搭MagicGUI大模型 智能助手YOYO实现从单智能体任务执行到多智能体协同的跨越式升级 [6] - YOYO具备感知、推理、规划、反思、执行全链路能力 可拆解复杂任务、调度跨应用资源 实现"一语打车"等场景 [6][9] - 在出行场景中 YOYO可自主调度高德、滴滴等应用 完成打开App、修改地址、选择车型、下发或取消订单等操作 [9] - 模型能根据屏幕视觉信息边思考边行动 依据页面反馈精准推理下一步操作 遇到指令错误可主动停止并切换人工接管 [9] 生态建设 - 公司作为首批单位与中国电子技术标准化研究院、阿里、百度等百余家企业发布《智能体协议共建共享联合倡议》 [10] - 联合20余家企业推动终端智能化分级指南标准落地 牵头10余个AI终端标准立项及起草 [10] - 与中国信息通信研究院、阿里、百度等发布《人工智能安全承诺》实践披露成果 涵盖6大核心内容和20项关键安全标签 [11] - 联合行业伙伴发起"智能体创新推进计划" 围绕技术攻关、应用拓展、生态建设推动智能体技术产业化落地 [11] 开放合作 - 将模型技术报告、参数配置、评估数据等核心要素向公众开放 旨在打破AI技术壁垒 推动行业技术共享与创新 [12] - 自2023年起与复旦大学共建自然语言处理大模型校企联合实验室 在自然语言理解、多模态大模型等领域深度合作 [13] - MagicGUI大模型是校企合作成果 通过联合设计数据生成框架、优化训练方案等实现终端场景领先的"理解-规划-操作"一体化能力 [13] - 模型与相关测试数据将于近期上线开源平台 公司期待与各界伙伴携手加速AI终端生态普惠化进程 [14]
阿里加入百镜大战,首款AI眼镜带显、支持导航和淘宝比价
南方都市报· 2025-07-26 16:37
产品发布 - 阿里巴巴正式发布首款自研带显示屏的AI眼镜"夸克AI眼镜",预计年内正式上市[1] - 产品已完成研发并在2025世界人工智能大会(WAIC)现场展示,但暂未开放体验[1] - 产品价格信息将在后续正式发布时公布[1] 产品功能 - 支持高德导航、支付宝"看一下"支付、淘宝比价、飞猪商旅提醒等阿里生态应用[1][3] - 具备通话、音乐、翻译、会议纪要等主流功能[5] - 研发团队联合高德地图开发近眼显示导航系统,可在骑行、步行场景显示导航箭头、距离和速度数据[3] - 配备通义千问大模型和夸克最新AI能力,提供视觉问答和学习办公能力原生适配[3][5] 技术突破 - 硬件结构进行系统重构,在AI交互、佩戴舒适度、显示与影像、续航等方面实现突破[5] - 解决现有产品佩戴不适、续航短、AI交互弱等痛点问题[5] - 将联合全球领先眼镜品牌整合技术、渠道、服务及C2M定制能力[5] 战略意义 - 标志着公司在AI领域的又一次战略性布局[1] - 代表AI to C战略从软件领域延伸至多形态硬件[1] - 被视为下一代人机交互的"感官中枢",将催生个人数据量急剧爆发[3] 行业现状 - 2023年二季度眼镜厂商集中发布新品,包括小米、Rokid等10款产品[5] - 当前主流功能集中在翻译、AI问答、识图等基础应用[5] - 部分厂商已开发"看一下"支付、提词器和智能导航等特色功能[5]
The S&P 500 Is Crushing Apple This Year -- Here's Why
The Motley Fool· 2025-07-26 16:18
核心观点 - 苹果公司面临多重挑战 包括关税压力 AI领域竞争劣势等 但长期前景依然强劲 [1][2][7] - 公司拥有强大品牌优势 高转换成本 服务业务增长等核心竞争优势 [11][12][13] - 尽管短期股价承压 但自由现金流充裕 股息增长稳定 仍具投资价值 [14] 经营挑战 关税压力 - 特朗普政府关税政策直接冲击中国生产基地 可能显著抬升制造成本 [3][4] - 中国产能占比高 美国本土生产iPhone成本可能难以承受 [6] - 计划未来四年投入5000亿美元扩建美国本土产能 包括新建AI服务器工厂 [8] 技术竞争 - 在快速增长的人工智能市场被认为落后于同规模科技巨头 [7] - 历史表明公司擅长改进现有技术而非首创 仍具后发优势 [13] 竞争优势 业务韧性 - 拥有全球最具价值品牌之一 形成强大护城河 [11] - 过去12个月产生985亿美元自由现金流 资金实力雄厚 [14] 用户粘性 - iOS系统转换安卓存在数据迁移困难 形成天然用户锁定 [12] - 多设备协同功能增强生态粘性 应用商店具备网络效应 [12] 增长引擎 - 服务业务增速持续领先硬件 已超20亿台活跃设备 10亿付费订阅 [13] - 股息连续十年增长 提供稳定回报预期 [14] 应对策略 - 采用多管齐下方案 包括产能转移至非关税目标国家 [9] - 贸易政策存在变数 最终影响可能低于预期 [10]
Billionaires Sell Apple Stock and Buy a Stock-Split Stock Up 510% in the Last Decade
The Motley Fool· 2025-07-26 15:45
对冲基金交易动向 - 多家对冲基金在第一季度减持苹果股票并买入O'Reilly Automotive股票 [1] - David Shaw的D E Shaw & Co减持苹果6%股份(340,900股) 同时买入19,000股O'Reilly Automotive [7] - Louis Bacon的Moore Capital Management减持苹果97%股份(495,800股) 同时新建240股O'Reilly Automotive仓位 [7] 苹果公司分析 - 第一季度营收增长5%至950亿美元 GAAP净利润增长5%至248亿美元 [4] - 服务业务实现两位数增长 主要来自广告 App Store和云存储业务 [4] - 过去七年缺乏突破性新产品 最近一次重大创新是2017年AirPods [6] - AI领域进展缓慢 原计划推出的Siri AI升级多次推迟 [5] - 过去三年每股收益年复合增长率不足2% 若剔除股票回购则下降近5% [8][9] - 当前市盈率33倍 华尔街预计未来三年盈利年增长11% [8] O'Reilly Automotive分析 - 过去十年股价上涨510% 2024年6月完成15比1的股票拆分 [1] - 北美最大汽车后市场零售商 运营6,400家门店 服务DIY和专业客户 [10] - 第二季度营收增长6%至45亿美元 同店销售增长41% 新开67家门店 [12] - GAAP每股收益增长11%至078美元 公司回购680万股股票 [12] - 特朗普政府对进口汽车征收25%关税可能利好业务 因消费者更倾向维修旧车 [11] - 当前市盈率36倍 华尔街预计未来3-5年盈利年增长10% [13]
DORK--美股“最闪耀”的名词
华尔街见闻· 2025-07-26 14:57
DORK概念股投机热潮 - DORK概念股由Opendoor(OPEN)、Kohl's(KSS)、Krispy Kreme(DNUT)和GoPro(GPRO)等公司股票代码首字母组成,成为最新散户投机标的 [1] - Opendoor周一单日暴涨43%,Krispy Kreme盘中飙升39%,GoPro短时间内飙升73%,但涨势迅速消退,Opendoor周三收盘下跌超20%,Kohl's从周二高点回落14%,Krispy Kreme较峰值下跌27% [1] - 散户投资者今年前六个月净购买1553亿美元股票,创至少十年来最高纪录 [1] 公司基本面分析 - Opendoor去年营收同比下降26%,净亏损3.92亿美元,GoPro去年营收下跌20%,净亏损4.32亿美元 [2] - 分析师评论称这些公司"即使没有完全破产,也是确实有残疾的公司",投资者情绪接近"狂热水平" [2] 市场结构变化 - 与2021年Meme股热潮相比,DORK炒作仅持续1-2个交易日,期权市场协调行动作用较小,标普500前100只股票中看涨期权倾斜比例最高仅21%(2021年超50%) [3] - 零日期权合约占标普500本季度期权总量的62%,创纪录新高,其中超一半由散户交易推动 [3] - 新一代投资者对期权和市场结构更精明,投机行为已融入现代市场架构 [3] 投机资金多元化分流 - 高盛最受做空的一篮子股票指数自4月初以来飙升超60%,垃圾债券中CCC级债券有望连续第七周上涨 [4] - 加密货币基金过去四周流入122亿美元,创同期累计流入最高纪录 [4] - 美国杠杆贷款市场经历有史以来最繁忙一周,垃圾级公司多次重新定价借贷 [4] - 投机资金转向数字代币、杠杆ETF、博彩市场等更高风险领域,Meme股交易失去新颖感 [4]
荣耀发布MagicGUI自研开源大模型,首发搭载折叠屏Magic V5
快讯· 2025-07-26 13:45
公司动态 - 公司在2025世界人工智能大会(WAIC)期间正式发布MagicGUI自研多模态感知大模型 [1] - MagicGUI是公司推出的首个GUI开源大模型,参数规模为7B(70亿) [1] - 该大模型首发搭载应用于AI折叠旗舰荣耀Magic V5 [1] - 在荣耀Magic V5常用场景用机操控中的准确率达到91.5% [1] 技术能力 - MagicGUI大模型支撑底层AI智能体的多模态感知与自动执行规划能力 [1] - 在移动端的视觉定位能力、页面理解问答能力、单步操作能力、动作序列拆解执行能力4类任务跑分全面领先 [1] - 对比行业同类顶级开源模型,准确率提升16.4% [1] 行业影响 - MagicGUI大模型已达到行业领先水平 [1] - 该模型的推出将加速AI在手机领域的落地 [1]
苹果新专利:MacBook Pro 或迎轻量化与降噪散热新升级
环球网资讯· 2025-07-26 11:24
苹果新专利技术 - 公司获批一项创新专利,聚焦轻量化多层风扇组件,有望显著减轻MacBook Pro重量同时保持结构完整性、散热性能和电气连接 [1] - 专利核心在于复合底座结构设计,结合金属层与塑料、碳纤维、玻璃纤维等轻质材料,在保证刚性同时防止用户操作导致的风扇形变 [3] - 新设计降低风扇叶片与风扇盖接触风险,减少噪音和磨损,提升用户体验 [3] 技术细节优化 - 核心层可能包含印刷电路板(PCB),减少对外部柔性电缆和连接器的需求,实现风扇电机、驱动电路与主板直接连接 [3] - 单独成型组件设计允许使用更薄风扇盖和更大叶片间隙,减少摩擦噪音并改善气流一致性,提升散热效果 [3] - 额外金属层提高热导率,定制热膨胀系数优化热量管理,确保高负荷运行稳定性 [3] - 风扇底座内导电路径减少外部电缆依赖,安装凸台作为低阻抗接点优化电源传输 [3]
Meta发布“意念操控”腕带,研究登Nature,要抢马斯克生意?
36氪· 2025-07-26 10:15
技术突破 - 推出基于表面肌电图(sEMG)的通用型非侵入性神经运动接口,以腕带形式呈现,无需侵入性手术即可精准捕捉手腕神经信号,识别点击、滑动和捏合等多种手势意图[1] - 摆脱对键盘、鼠标、触摸屏等传统输入设备的依赖,且不受动作遮挡影响,相比侵入性脑机接口无需定制解码器,可在不同人群中通用化应用[3] - 基于300多名受试者提供的超过100小时肌电数据,开发出高度适应性的机器学习模型,无需个人校准即可实现高精度手势识别,少量个性化数据可使笔迹识别准确率提升16%[3] 硬件与模型设计 - 研发高灵敏度sEMG腕带(sEMG-RD),采用干电极、多通道记录设计,采样率达2kHz,噪音低至2.46μVrms,续航超4小时,四种尺寸适配不同腕围[4] - 优化电极布局以精准捕捉手腕、手部和前臂肌肉电信号,可检测单个运动单位动作电位(MUAPs),通过材料测试与结构优化平衡佩戴舒适性与信号稳定性[4] - 构建可扩展数据收集基础设施,从数千参与者获取训练数据,开发通用sEMG解码模型,采用LSTM、1D卷积层加LSTM层、Conformer架构等深度学习技术适应不同交互场景[6] 性能表现 - 连续导航任务中闭环手势解码中位数性能为0.66次/秒,离散手势任务识别速率达0.88次/秒[7][9] - 手写输入速度达20.9字/分钟,个性化调整后解码性能可提升16%[9] - 离线评估中对未训练参与者的手写和手势检测分类准确率超90%,手腕角度速度解码误差小于13°s⁻¹,在不同年龄、性别、身体状况群体中表现稳定[12] 应用前景 - 日常交互:适用于智能手机、智能手表、智能眼镜等移动设备,解决移动场景下传统输入方式的局限性[13] - 辅助技术:为行动不便者提供新交互方式,通过细微肌肉活动控制轮椅、假肢等辅助设备[13] - 医疗康复:用于临床诊断和康复治疗,监测肌肉活动情况,辅助制定个性化康复方案[14] - 工业控制:实现自然方式远程操控复杂设备,减少操作失误,提高生产效率[14] 行业影响 - 技术前期验证通过Meta的Orion AR眼镜原型完成,2025年核心成果发表于Nature期刊[16] - 有望从专业AR设备拓展为通用电子设备交互标准,重新定义下一代人机交互范式[17][18] - 为脑机接口领域提供借鉴,其大规模数据收集和模型训练方法可能解决其他接口的校准问题[15]