告别「人工智障」，全新Siri深夜炸场，苹果AI「换心」Gemini成功

文章核心观点 - 苹果公司在WWDC26上发布了其全新的“Apple智能”AI系统，核心是基于谷歌Gemini基础模型改造并私有化的Apple Foundation Model，标志着公司AI战略进入新阶段[4][7][8] - 此次AI更新的功能（包括Siri AI及各类AI增强应用）目前均不向中国内地及欧盟用户提供，属于“环内地、环欧盟”发布[4][30] - 苹果通过设备端模型与私有云计算结合的混合架构，强调了对用户隐私的保护，并将AI能力深度集成至其全平台生态系统[10][12][15] - 尽管通过引入外部技术解决了AI能力落后的燃眉之急，但公司在AI领域仍面临无法进入中国市场以及需要追赶AI Agent技术趋势两大核心挑战[44] Apple智能模型与架构 - 新一代Apple Foundation Model基于谷歌Gemini基础模型改造而来，并非直接使用，形成了苹果私有的基础模型[8][9] - 该模型采用混合架构，分为可在iPhone、iPad、Mac等设备端直接运行的版本，以及在苹果私有云计算服务器上运行的版本[10] - 公司同时推出了第二代设备端模型，提升了多模态能力[13] - 该架构设计旨在将用户数据最大限度控制在苹果可控范围内，以保护隐私，公司声称无法获取用户数据，数据仅用于响应用户请求[12] Siri AI的全面升级 - 由Apple智能驱动的新版语音助手命名为“Siri AI”，其交互与理解能力显著提升[18] - Siri AI首次拥有了独立的应用程序，提供统一的交互记录入口[19] - 交互方式新增通过顶部下拉激活的“灵动岛Siri”界面[20] - 核心能力具备“感知”、“理解”、“调用”、“执行”四大维度[22] - 感知能力实现多模态突破，不仅能“听”用户语音，还能“看”相机拍摄和屏幕显示的内容，包括图片和文字[22] - 能基于感知的屏幕内容执行复杂任务，例如根据旅游照片创建行程规划，或调用多个系统应用[25] - 在macOS上，Siri AI能直接对多份文档进行对比、总结和修改，功能类似AI Agent[26] - 支持用户通过“拖进度条”方式自定义Siri AI的音色、语气和语速[28] - 当前仅支持英语，未来将支持包括简体中文在内的多种语言，但国行设备暂不可用[30] 系统与核心应用的AI赋能 - Safari浏览器：利用AI对打开的标签页进行智能分组；能后台智能监控网页内容更新并发送通知；支持用户通过自然语言描述，让AI自动生成所需功能的浏览器插件[32] - 快捷指令：接入AI后，用户可用自然语言描述复杂需求（如“当我5分钟后有外地日程，且行程没有机票或车票信息时，自动打开车内空调”），应用将自动搜索各App能力并生成执行指令[34] - 家庭App：对于使用HomeKit摄像头的用户，App可后台分析监控画面并总结成文字，或根据用户提问定位对应视频片段[36] - 图乐园：新增自然语言生图功能，并可依要求调整风格与画面内容；为相册App加入“空间构图”能力，可将不同照片转化为带深度信息的空间照片并重新取景，增加了“Z”轴维度[38][40] - “空间构图”等功能采用混合模型处理：先由设备端模型实现低延迟实时操作，再调用私有云计算完成完整渲染[40] 商业模式与行业挑战 - 部分依赖私有云计算的AI功能设有每日使用次数限制，但相关权益将纳入iCloud+服务[42] - 苹果在AI领域面临两大挑战：一是其Apple智能至今未能进入中国市场，需要完成AFM的本地合规化流程；二是AI行业已向更高级的自主Agent演进，公司需快速补齐技术积累[44] - 公司当前通过采购并改造Gemini基础模型解决了AI能力落后的紧迫问题，但长期来看，依赖外部技术采购并非可持续战略，在快速演进的AI行业中，公司仍有很长的路要走[44]