计算机行业点评:GPT-4o:大模型风向标,OpenAI重大更新
德邦证券·2024-05-14 21:30

报告的核心观点 - 美国时间5月13日,OpenAI发布了两项重大更新:1)发布桌面版APP及更新UI后的ChatGPT,用户使用更加简单与自然;2)发布新的全能模型GPT-4o,实现跨模态即时响应,相比GPT-4 Turbo,性价比显著提升的同时向用户免费开放。[10] 桌面版及新UI ChatGPT,极致的用户交互体验 - 公司推出了适用于macOS的新ChatGPT桌面应用程序,支持与计算机语音对话,提升用户与模型交互体验。用户可通过简单的键盘快捷键向ChatGPT提问,并支持直接在应用程序中截取屏幕截图进行讨论。[11][12] - 公司还全面改版了UI界面,旨在提供更加友好和更具有对话性的外观,让用户与模型的互动更自然与简单。[13] GPT-4o实现毫秒级视觉音频理解,价格方面更具优势 - GPT-4o具有以下亮点:1)毫秒级响应,实现即时语音对话,GPT-4o对音频输入的响应时间最短为232毫秒,平均为320毫秒;2)更先进的视觉与音频理解能力,可随时打断对话并根据场景生成多种音调;3)API性价比显著提升,与GPT-4 Turbo相比,速度提升2倍、成本降低50%,且速率限制提升5倍;4)免费提供给所有用户使用,付费用户享受五倍的调用额度。[14][15][16][17] 端到端多模态GPT-4o,刷新SOTA性能飞跃 - 传统语音AI通常经过三步法实现对话功能,在这过程中会丢失很多信息且不能判断情绪变化。而GPT-4o为跨模态端到端训练新模型,意味着所有输入和输出都由同一神经网络处理,成为真正的多模态统一模型,带来性能的飞跃提升。[18][19] - 在传统基准测试中,GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉功能上达到了新的高水位线。[20][21][22] - 在端到端多模态架构支持下,GPT-4o多模态能力范围显著拓展,除了文本、图像等常用功能,还支持3D物品合成、文本转字体等多样化功能。[24][25] 投资建议 - 公司认为,GPT-4o是多模态大模型走向成熟的重要标志,未来有望推动产生更多现象级AI应用,并进一步提升推理算力需求。[26] - 建议关注AI多模态、AI算力、AI+办公、AI+教育/电商/医疗等相关领域的上市公司,如万兴科技、虹软科技、云赛智联、金山办公、科大讯飞等。[26] 风险提示 - AI技术迭代不及预期、产品落地不及预期、AI伦理风险等。[27]

计算机行业点评:GPT-4o:大模型风向标,OpenAI重大更新 - Reportify