百度进军AI视频生成领域 - 公司推出视频生成MuseSteamer模型及"绘想"平台 瞄准搜索、广告和推荐场景的原生化内容生产痛点 [1] - 与Sora等通用视频生成模型不同 公司选择聚焦特定场景的视频生成 避免长期投入风险 [1][7] - 技术团队解决了中文语境下多模态语义对齐的核心挑战 实现视觉元素与声音信息的自然协同 [1][2] MuseSteamer模型技术特点 - 采用"场景颗粒度拆解"方案 将亿级中文视频数据分为23个高频场景 并细分为"动作-情绪-效果"三级标签 [2] - 在电商场景中 模型能精准理解"这件裙子垂感很好"等描述 并匹配对应的音画表现形式 [2] - 支持一体化生成带音效和人物台词的视频 可生成5秒和10秒两个版本 均达到1080p清晰度 [4] 商业化应用与竞争优势 - 推出Turbo、Lite和Pro三个版本 分别面向中小商家试错成本敏感和专业机构时间成本痛点 [4][6] - 有声版支持粤语、川语等8种方言即时生成 大幅降低区域化营销内容的边际制作成本 [7] - 与百度广告平台深度协同 利用亿级用户互动数据优化模型 形成数据壁垒 [9] 行业竞争格局 - 快手可灵AI在1080p模式下生成5秒视频仅需不到60秒 年化收入运行率突破1亿美元 [7] - 公司采取差异化竞争策略 专注搜索、广告等商业场景而非泛娱乐内容 [7][8] - 模型生成的视频可直接接入百度信息流广告系统 实现"创作-分发-反馈"闭环 [8] 技术落地与行业趋势 - 行业竞争焦点从"能不能生成"转向"生成的内容能不能用" [11] - 公司通过精准捕捉商业场景需求 提供技术落地的可行范式 [11] - 填补传统视频制作流程中的效率洼地 推动AIGC视频工具的商业化应用 [11]
赛道Hyper | 百度取道特定场景攻略AGI视频