音频AI模型
搜索文档
OpenAI整合团队开发音频AI模型 为发布AI个人设备铺路
新浪财经· 2026-01-01 23:32
OpenAI音频AI模型优化与硬件战略 - 公司正整合工程、产品和研究团队,在过去两个月内共同推进音频模型的优化,以应对当前语音模型在回答准确性和响应速度上落后于文本模型的挑战 [2] - 新音频模型架构旨在生成更自然、更具情感且更精准深入的回应,同时支持与用户实时对话并更好地处理对话打断,现有模型无法实现此功能 [2] - 该新音频模型的目标发布时间为2026年第一季度 [2] OpenAI消费级AI设备计划 - 公司计划推出一款主要依赖音频交互、支持语音指令的消费级设备,首款设备预计至少一年后面世 [2] - 与谷歌、亚马逊、Meta和苹果类似,公司正探索开发新型个人AI设备,包括可穿戴设备 [3] - 公司计划逐步发布一系列设备,如眼镜、无屏智能音箱,而非单一产品 [4][8] 设备设计理念与交互愿景 - 公司研究人员希望用户通过语音而非屏幕与设备交互,许多AI专家认为语音是更自然的交互方式 [3] - 无屏设计可能减少用户对设备的依赖,与公司合作硬件开发的前苹果设计主管乔尼·艾夫强调,纠正以往消费电子产品的负面影响是其首要目标 [3] - 在今夏的内部演示中,研究人员称该设备将作为用户的“协作伴侣”,主动提供目标达成建议,而非仅作为应用入口,设备还能通过音频捕捉环境与用户信息,实现情景化交互 [4][8] 面临的挑战与团队构成 - 公司面临一大挑战:多数ChatGPT用户尚未养成语音交互习惯,或因音频模型质量不足,或因未意识到该功能,推出以音频为核心的AI设备需先培养用户习惯 [3] - 音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar [3] - 项目其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse,以及多模态ChatGPT产品经理Jackie Shannon [3]