百度自研的视频生成模型还是来了
百度发布视频生成模型MuseSteamer - 公司正式发布自研视频生成模型MuseSteamer及视频产品平台"绘想",采用DIT架构,参数与业界最大视频生成模型同量级,支持生成10s动态视频,最高分辨率1080P [1] - 模型由移动生态商业研发团队开发,非技术中台部门TPG主导,定位为商业驱动型产品,旨在解决广告主生成科幻场景视频的需求 [1][4] 模型研发背景与策略 - 公司CEO李彦宏曾于2023年10月表示不做通用视频生成模型,但支持基于多模态的特定场景开发,如罗永浩数字人和MuseSteamer均针对特定需求 [2] - 项目2024年春节后立项,研发团队数十人,3个月内完成开发,技术积累来自擎舵平台的多模态生成能力和商业体系的模型训练框架 [4] 商业化进展与产品定位 - "绘想"平台定位B端营销产品,Turbo版已开启限时免费公测,其余版本计划8月开放,目前平台已生成超100个AIGC广告并投放 [4] - 公司未明确是否服务C端用户,但已将模型接入百度搜索,未来可能扩展至更多C端产品 [5] 行业差异化特点 - 区别于市场主流技术驱动型视频生成模型,公司采用商业驱动模式,先明确广告营销场景需求再反向研发模型 [4]