行业投资评级 - 推荐(维持)[13] 报告的核心观点 - OpenAI 12 Days 完结,向 AGI 再近一步 [10][20] 根据相关目录分别进行总结 一、Open AI 12 Days 完结,向 AGI 再近一步 (一) 核心要点 1: o3 模型发布,AGI 之路曙光乍现 - o3 模型在编码、数学以及 ARC-AGI 基准测试等多个基准上大幅超过了 Open AI 此前的 o1 模型 [10][40] - 在博士水平的科学问题(GPQA)测试中,o3 模型得分为 87.7%,超过博士生一般得分 70% [11] - 在最难的前沿数学测试中,o3 模型得分为 25.2%,其他模型没有超过 2% [41] - 在证明是否达到 AGI 的题目 ARC-AGI 测试中,o3 模型得分为 87.5%,o1 的得分为 25% [20] - Codeforces 评分:2727,相当于全球人类程序员编码竞赛中,排名第 175 位,超过 99%的人类程序员 [20] (二) 核心要点 2: o1 完全版发布,打开多领域应用场景 - o1 在国际数学奥林匹克预选赛题目(AIME 2024)、编程能力测试(CodeForces)方面都比 o1-preview 提升了 50% [11] - 在处理复杂问题时的重大错误率降低了 34%,用户等待时间下降超过 50% [11] - o1 支持多模态识别,相关领域实用性提升,如分析医学影像,识别图纸,提供创意建议等 [11] (三) 核心要点 3: Sora 正式发布,AI 生成视频最新想象力 - Sora 具备世界模拟能力,用户可以对生成的视频进行多种操作,包括风格预设、Remix、Re-cut、混合、故事板等 [12][23] - Sora 目前只对 ChatGPT Plus 和 Pro 用户开放,订阅费分别为 20 美元/月和 200 美元/月 [23] (四) 核心要点 4: Open AI 的内置 Agent——Canvas - Canvas 是基于 GPT-4o 模型开发而成,提供了一个单独的窗口,可以与 ChatGPT 一起执行编程、写作任务,帮助提供意见、审核和执行具体的功能 [25][44] - 例如,当编写代码时遇到困难,Canvas 可以高亮显示有问题的代码段,帮助 ChatGPT 提供内联的调试建议快速修复这些错误 [25] (五) 其他要点 - o1-mini 强化微调改变了过去微调只是通过增加专业数据的逻辑,而是对具有推理能力的模型进行强化学习方向的微调,测试通过率比传统的 o1 模型高出 24%,相比未经过强化微调的 o1mini 则提升了整整 82% [28][48] - 高级视频语音模式允许 OpenAI 的工作人员与 4o 视频通话,可以看到实时的手机屏幕内容,或者根据相机里的实时画面和用户聊天/解答问题 [32][51] - ChatGPT 和 Apple Intelligence 整合,主要包含与 Siri 的协同、写作工具的增强、iPhone 16 的相机控制功能等 [33][49] - 其他小功能更新包括 "Projects" 项目功能、ChatGPT 搜索升级、4o 热点、o1 图像输入和 4o 高级语音 API 正式开放等 [34][35][53] 二、投资建议与相关标的 - 建议关注以下标的:AI 工具侧:SNOW,CFLT,API,TWLO 等;AI 应用侧:CRM,NOW,TEAM,FRSH 等;A/H 股:办公、金融、大模型、工业、穿戴/玩具、医疗、法律、邮箱、创意、教育、电商、数据、ERP、OA、安全、算力等领域的企业 [1][71]
海外科技行业跟踪点评报告:OpenAI12Days,人类距离AGI再近一步
华创证券·2024-12-24 14:00