告别「人工智障」,全新Siri深夜炸场,苹果AI「换心」Gemini成功
苹果苹果(US:AAPL) 36氪·2026-06-09 18:12

文章核心观点 - 苹果公司在WWDC26上发布了其全新的“Apple智能”AI系统,核心是基于谷歌Gemini基础模型改造并私有化的Apple Foundation Model,标志着公司AI战略进入新阶段[4][7][8] - 此次AI更新的功能(包括Siri AI及各类AI增强应用)目前均不向中国内地及欧盟用户提供,属于“环内地、环欧盟”发布[4][30] - 苹果通过设备端模型与私有云计算结合的混合架构,强调了对用户隐私的保护,并将AI能力深度集成至其全平台生态系统[10][12][15] - 尽管通过引入外部技术解决了AI能力落后的燃眉之急,但公司在AI领域仍面临无法进入中国市场以及需要追赶AI Agent技术趋势两大核心挑战[44] Apple智能模型与架构 - 新一代Apple Foundation Model基于谷歌Gemini基础模型改造而来,并非直接使用,形成了苹果私有的基础模型[8][9] - 该模型采用混合架构,分为可在iPhone、iPad、Mac等设备端直接运行的版本,以及在苹果私有云计算服务器上运行的版本[10] - 公司同时推出了第二代设备端模型,提升了多模态能力[13] - 该架构设计旨在将用户数据最大限度控制在苹果可控范围内,以保护隐私,公司声称无法获取用户数据,数据仅用于响应用户请求[12] Siri AI的全面升级 - 由Apple智能驱动的新版语音助手命名为“Siri AI”,其交互与理解能力显著提升[18] - Siri AI首次拥有了独立的应用程序,提供统一的交互记录入口[19] - 交互方式新增通过顶部下拉激活的“灵动岛Siri”界面[20] - 核心能力具备“感知”、“理解”、“调用”、“执行”四大维度[22] - 感知能力实现多模态突破,不仅能“听”用户语音,还能“看”相机拍摄和屏幕显示的内容,包括图片和文字[22] - 能基于感知的屏幕内容执行复杂任务,例如根据旅游照片创建行程规划,或调用多个系统应用[25] - 在macOS上,Siri AI能直接对多份文档进行对比、总结和修改,功能类似AI Agent[26] - 支持用户通过“拖进度条”方式自定义Siri AI的音色、语气和语速[28] - 当前仅支持英语,未来将支持包括简体中文在内的多种语言,但国行设备暂不可用[30] 系统与核心应用的AI赋能 - Safari浏览器:利用AI对打开的标签页进行智能分组;能后台智能监控网页内容更新并发送通知;支持用户通过自然语言描述,让AI自动生成所需功能的浏览器插件[32] - 快捷指令:接入AI后,用户可用自然语言描述复杂需求(如“当我5分钟后有外地日程,且行程没有机票或车票信息时,自动打开车内空调”),应用将自动搜索各App能力并生成执行指令[34] - 家庭App:对于使用HomeKit摄像头的用户,App可后台分析监控画面并总结成文字,或根据用户提问定位对应视频片段[36] - 图乐园:新增自然语言生图功能,并可依要求调整风格与画面内容;为相册App加入“空间构图”能力,可将不同照片转化为带深度信息的空间照片并重新取景,增加了“Z”轴维度[38][40] - “空间构图”等功能采用混合模型处理:先由设备端模型实现低延迟实时操作,再调用私有云计算完成完整渲染[40] 商业模式与行业挑战 - 部分依赖私有云计算的AI功能设有每日使用次数限制,但相关权益将纳入iCloud+服务[42] - 苹果在AI领域面临两大挑战:一是其Apple智能至今未能进入中国市场,需要完成AFM的本地合规化流程;二是AI行业已向更高级的自主Agent演进,公司需快速补齐技术积累[44] - 公司当前通过采购并改造Gemini基础模型解决了AI能力落后的紧迫问题,但长期来看,依赖外部技术采购并非可持续战略,在快速演进的AI行业中,公司仍有很长的路要走[44]

告别「人工智障」,全新Siri深夜炸场,苹果AI「换心」Gemini成功 - Reportify