Workflow
计算机行业周报:OpenAI持续上新,字节豆包成国内顶流
上海证券·2024-12-18 10:06

行业投资评级 - 增持(维持)[3] 报告的核心观点 - OpenAI 新品迭出,多模态能力持续升级,字节豆包生态持续壮大,AI 应用有望加速发展[4][5] 根据相关目录分别进行总结 市场回顾 - 过去一周(12.9-12.13)上证综指下跌 0.36%,创业板指下跌 1.40%,沪深 300 指数下跌 1.01%,计算机(申万)指数下跌 1.25%,跑输上证综指 0.89 个百分点,跑赢创业板指 0.15 个百分点,跑输沪深 300 指数 0.25 个百分点,位列全行业第 28 名[3] 周观点 - OpenAI 新品迭出,多模态能力持续升级。自 12 月 5 日开始,OpenAI 已连续开启六场直播,目前已推出 o1 完整版及 ChatGPT Pro 模式、强化微调能力、全新的视觉处理技术 Sora、正式上线 Canvas、ChatGPT 集成到 iOS、iPadOS 和 macOS 系统以及实时视频通话、实时理解屏幕、图像上传。其中,Sora 方面,相较于 2 月的原版 Sora,本次带来了更高级的加速版 Sora Turbo,包括文本到视频、图像到视频、视频到视频的功能,具体有 Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)以及Style presets(风格预设)。Sora能生成任意长宽比的视频,分辨率从480p到1080p,时长从5秒到20秒,可以一次生成多个方向的视频版本,让使用者选择其中最理想的一个。高级语音模式方面,带来了三大功能更新——实时视频通话、屏幕共享和图像上传,由 GPT-4o 支持。这意味着 ChatGPT 能够通过视觉和听觉与用户互动,提供实时的视觉互动体验,就像与真人视频聊天一样自在。此外,12 月 12 日,谷歌发布 Gemini 2.0 Flash,反应速度快(是上一代的 2 倍),性能强大,支持图像、视频和音频等多模态输入,支持多模态输出,还能够原生调用工具,如谷歌搜索、代码执行以及第三方用户自定义函数,代表了谷歌 Gemini 最顶尖的技术水平[4] 字节豆包生态持续壮大,AI 应用有望加速发展 - 豆包生态不断壮大。今年 5-7 月,豆包 APP 日新增用户从 20 万迅速飙升至 90 万,并在 9 月率先成为国内用户规模破亿的首个 AI 应用。量子位智库数据显示,截至 11月底,豆包 2024年的累计用户规模已超过 1.6亿;11 月平均每天有 80 万新用户下载豆包,单日活跃用户近 900 万,位居 AI 应用全球第二、国内第一。豆包功能持续优化。12 月 10日,字节跳动视频生成模型 PixelDance 在豆包电脑版正式开启内测,用户每日可免费生成十支视频。此外,用户还可使用时序提示词、长镜头等技巧,增强视频的复杂度和表现力。12 月 18-19 日,火山引擎将举行 FORCE2024 原动力大会,豆包大模型将迎来全新升级。目前,字节跳动在 AI 产品应用和落地方面成果显著,C 端推出了一系列 AI 产品应用,覆盖 AI 智能助手、AI 创作、AI 社交、AI 智能开发平台等关键领域,B 端通过火山引擎与企业客户合作,利用豆包大模型为企业提供一站式的 AI 解决方案,在多个行业实现了 AI 应用落地[5] 投资建议 - 建议关注:(1)AI 算力:海光信息、寒武纪、中科曙光、神州数码、软通动力、华丰科技、泰嘉股份、安博通、品高股份等;(2)AI 应用:科大讯飞、金山办公、万兴科技、拓尔思、梅安森、鼎捷数智、汉得信息、能科科技、佳发教育等[7]