字节大模型,重磅发布!
证券时报·2026-02-14 15:32

豆包大模型2.0及多模态模型系列发布 - 字节跳动在春节期间发布豆包大模型2.0(Doubao-Seed-2.0),这是其多模态Agent模型自2024年5月发布以来的首次大版本跨代升级 [1] - 同期发布的还包括视频生成模型Seedance 2.0和图像创作模型Seedream 5.0 Lite,三大模型“三箭齐发”,实现了多模态Agent、AI图像、AI视频创作的全维度技术突破 [1][7] - 此次系列升级被业界视为“枪挑Sora、硬刚Nano Banana”,彰显了公司在多模态AI领域的技术领跑与全链路布局优势 [1][7] 豆包大模型2.0的核心技术亮点 - 具备更稳健的视觉与多模态理解能力,对复杂文档、表格、图形、视频内容的解析水平显著提升 [3] - 具备更可靠的复杂指令执行能力,强化了对多约束、多步骤、长链路任务的理解与执行,已具备支撑高价值任务的能力基础 [3] - 提供更快速、更灵活的推理选择,推出了Pro、Lite、Mini三款不同尺寸的通用Agent模型以及专门的Code模型,以覆盖不同场景需求 [3] - 全面升级多模态能力,在各类视觉理解任务上达到业界顶尖水平,其视觉推理、感知能力、空间推理与长上下文理解能力表现突出,豆包2.0 Pro在大多数相关基准测试中取得了最高分数 [3] - 实测显示,模型在图片识别与理解、智能分析方面表现优秀,例如能精准识别图片中不同种类和颜色的花朵 [4] 图像与视频生成模型的性能突破 - 图像创作模型Seedream 5.0 Lite以跨模态理解与参考为核心特色,用户只需输入参考图和简单描述,模型即可理解并生成所需图片风格,极大降低了创作门槛 [7][8] - Seedream 5.0 Lite具备实时检索能力,支持联网检索,例如可根据实时检索结果绘制指定日期时段的金价走势图 [11] - 视频生成模型Seedance 2.0被称作“导演级AI”,用户通过编写详细提示词或上传参考图片,即可生成带有原生音频的多镜头序列视频,效果可媲美动漫电影制作 [13] - Seedance 2.0以“1分钟生成好莱坞级大片”的效果在全球引发轰动,并引爆了A股AI应用、文化传媒、短剧游戏等板块行情 [1] - 知名导演贾樟柯在个人微博表示“Seedance 2.0确实厉害,我准备用它做个短片”,影视、短剧、游戏行业从业者感叹“人均导演的时代到来了” [14] 产业应用与市场影响 - 豆包大模型提供了一种极具成本效益的多模态大模型解决方案,有望推动前沿AI技术在千行百业的规模化应用 [17] - 下游应用场景需求有望迎来爆发,包括短视频营销、电商素材、AI漫剧、游戏制作、数字内容创作等 [17] - AI极大降低了文字IP向视频内容转化的门槛,海量优质IP储备的公司将直接受益,上游IP方数字资产有望重估 [17] - 中游制作方中,能高效结合AI工具赋能内容创作、特别是拥有稀缺导演/编剧资源的公司被看好 [17] - 多模态能力全面落地与内容创作场景爆发,将带动云端训练与推理算力需求持续走高,有望推动AI芯片、智能服务器、云计算服务等上游算力环节快速增长 [17] 火山引擎平台与市场地位 - 字节跳动通过火山引擎对外提供豆包大模型服务,是其产业落地的核心载体 [18] - 截至2025年12月,豆包大模型日均使用量突破63万亿Tokens,居中国第一、全球第三 [18] - 2025年上半年,火山引擎在中国公有云上大模型调用量市场份额占比达49.2% [18] - 豆包大模型的重要升级,将巩固火山引擎在AI云市场的领先地位,推动AI能力在各行各业的深度落地 [18]