Workflow
微软全面升级Windows 11,语音成为核心交互方式
微软微软(HK:04338) 36氪·2025-10-17 17:39

战略定位与核心愿景 - 公司宣布其战略重点从单纯追求个人电脑处理性能转向打造智能化的对话式交互体验,旨在让每一台Windows 11设备都成为新范式的载体[2] - 此次重大升级标志着公司的一项战略赌注,即通过全面升级Copilot功能,使人机交互体验更自然,AI表现更聪明[2] - 公司执行副总裁表示,其目标是让用户拥有的个人电脑不仅仅是一个工具,而是真正值得信赖的助手和伙伴[16] 语音交互功能升级 - 公司正全力推动语音成为继键盘、鼠标之后的核心个人电脑交互方式,全面开放“Hey, Copilot”语音唤醒功能,用户无需点击图标即可通过语音开启对话[3] - 系统会以麦克风图标和提示音回应,确认处于聆听状态,结束对话可通过说“再见”或直接停止说话实现,此举旨在消除传统语音助手的使用门槛[3] - 公司内部数据显示,使用语音与Copilot交互的频率是纯文本输入的两倍[3] 视觉识别与上下文理解能力 - 公司全球上线Copilot Vision功能,使AI首次具备真正的视觉能力,能够实时分析和理解用户屏幕上的内容,并在任何应用程序中提供精准的上下文帮助[6] - 该功能的应用范围已从早期的单一程序支持扩展为“桌面共享”模式,可以识别并理解用户跨多个应用程序窗口的完整操作流程[7] - 其工作原理是当用户共享桌面或特定窗口时,Copilot能看到用户所看到的一切并实时讨论内容,应用场景包括为创意项目提供建议、帮助优化简历、指导游戏技巧等[8] - 该功能采取了谨慎的隐私保护策略,默认关闭,用户需要在每个会话中主动点击独特的“眼镜”图标授权才能启动屏幕共享[6] 本地任务执行与智能体演进 - 公司推出预览阶段的Copilot Actions功能,标志着AI从被动的“助手”向主动的“智能体”演进,首次能够在用户个人电脑上直接执行多步骤操作任务[4][10] - 该功能让Copilot具备实际操作能力,如打开应用、输入文字、滚动页面,用户只需用日常语言描述需求,智能体就会尝试通过与桌面和网络应用的交互来完成任务[10] - 用户在智能体后台工作时可继续专注于其他事务,并始终掌握控制权,可随时查看任务进度、审查具体操作或中断任务[12] - 需要注意的是,Vision功能目前仅具备“观察”和“建议”的能力,无法直接代表用户操作系统,执行操作由专门的Copilot Actions负责[9] 游戏娱乐体验整合 - 公司探索AI如何融入娱乐体验,例如在手持游戏设备领域,将便携游戏与人工智能助手技术融合[13] - 在如ROG Ally等设备上,用户长按“库”按钮即可唤出Gaming Copilot,它能在游戏过程中实时提供攻略推荐、操作技巧与场景解读,而玩家无需退出游戏或切换屏幕[15] - 该体验还能够快速访问来自Xbox、PC Game Pass及其他主流游戏商店的内容[15] 生态系统整合 - 公司通过Copilot连接器整合Gmail等第三方服务,以扩展其生态系统[2]