Workflow
传媒行业快报:GPT模型迭代更新,专注多模态与端侧应用
华金证券·2024-05-14 22:00

报告的核心观点 - GPT-4o是OpenAI发布的新一代旗舰生成模型,可接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出,实现了跨文本、视觉和音频的端到端训练[1][2] - GPT-4o具有实时反馈及情绪感知等特点,在语音翻译、视觉理解等方面表现优于现有模型,并支持3D内容生成[2] - GPT-4o在价格和效率方面具有优势,有助于应用生态的建立,可作为文本和视觉模型访问,未来或将对部分用户推出音频和视频功能[2] - 大模型的革新有望推动其下游应用发展,AI应用有望通过重构过往软件形态实现商业场景的落地,中国人工智能行业市场规模有望持续增长[2] 报告内容总结 模型特点 - GPT-4o实现了跨文本、视觉和音频的端到端训练,具有实时反馈及情绪感知等特点[2] - GPT-4o在语音翻译、视觉理解等方面表现优于现有模型,并支持3D内容生成[2] 应用优势 - GPT-4o在价格和效率方面具有优势,有助于应用生态的建立[2] - GPT-4o可作为文本和视觉模型访问,未来或将对部分用户推出音频和视频功能[2] 行业发展 - 大模型的革新有望推动其下游应用发展[2] - AI应用有望通过重构过往软件形态实现商业场景的落地[2] - 中国人工智能行业市场规模有望持续增长[2] 投资建议 - 建议关注相关标的:汤姆猫、昆仑万维、世纪天鸿、蓝色光标、南方传媒、天娱数科、引力传媒、捷成股份、视觉中国、华策影视、中广天泽、中信出版、万兴科技[2] 风险提示 - AI相关技术发展不确定性、政策不确定性、新产品用户接受度不确定性等[2]