Workflow
OpenAI Unveils GPT-4o, Promising Faster Performance and Enhanced Capabilities
MicrosoftMicrosoft(US:MSFT) PYMNTS·2024-05-14 05:54

文章核心观点 OpenAI于5月13日推出免费语言模型GPT - 4o,其在文本、视觉和音频处理上的改进可推动商业应用,进一步巩固公司在AI领域的领先地位 [1] 产品发布信息 - OpenAI宣布推出新语言模型GPT - 4o,“o”代表“omni”,所有用户可免费使用,付费订阅用户容量上限是非付费用户的五倍 [1] - 公司还将发布桌面应用,今日起向ChatGPT Plus订阅者开放,未来几周向所有免费和付费用户开放 [7] 产品功能提升 视觉升级 - GPT - 4o使ChatGPT能通过文本、语音和视觉交互,可查看用户上传的截图、照片等并交流,还具备记忆和实时翻译能力 [3] - 该模型展示了多模态能力,能分析图表图像并讨论内容,可应用于数据分析和可视化 [5] 速度提升 - GPT - 4o速度更快,平均响应时间320毫秒,使软件体验更以AI为先,减少按钮点击,增加语音和交互 [4] 情感智能 - 演示中GPT - 4o能通过听用户呼吸理解其情绪,发现用户压力大时提供放松建议,还能多语言交流、自动翻译和回答问题 [8] 语音交互优化 - 可改变聊天机器人语音回复的情感,提供更多回复控制 [6] - 解决了早期语音交互模型中三个组件协同工作导致的延迟和体验不流畅问题 [7] 行业影响 - 软件提供商可将GPT - 4o能力集成到软件中,有望满足即将出台的欧洲无障碍法案要求 [4] - 语音驱动AI结合实时响应和根据语气上下文调整回复的能力,将显著改变商业领域,提升和个性化购物体验 [5] - AI视觉功能使商业更具动态性,企业可提供视觉搜索等创新服务,提升用户体验和参与度,在零售和房地产等行业提供更互动和个性化服务 [6]