行业动态与竞争格局 - OpenAI于10月1日发布最新视频生成应用Sora 2,为全球视频生成赛道打响新的发令枪 [1] - 百度于10月15日官宣视频生成模型百度蒸汽机升级,谷歌于同一天夜间推出最新视频生成模型Veo 3.1版 [2][5] - 视频生成赛道竞争焦灼,各公司在技术上没有绝对长期优势,竞争焦点在于执行力和速度 [7] 百度蒸汽机模型技术特点 - 升级后的蒸汽机模型行业首次实现AI长视频实时交互生成功能,突破传统AI视频生成10秒左右的时长限制,理论支持无限时长生成 [2][5] - 模型支持图生视频和视频生视频双模式生成,用户可实时查看推理内容、随时暂停、修改提示词,实现对视频剧情、画面、转场的实时控制 [5] - 同步推出可交互数字人与开放世界动态构建两大功能,数字人支持沉浸式双向互动,开放世界允许用户在AI生成环境中自由探索 [5] 产品定价策略 - 百度蒸汽机Turbo有声版价格2.5元/秒,首发双周优惠为1.4元/5秒,C端用户在“绘想”平台会员充值定价41元/月起 [2] - Sora 2 API定价为0.1美元/秒起,C端用户需拥有ChatGPT Plus(20美元/月)或Pro(200美元/月)会员 [3] - 百度蒸汽机定价为行业同类产品的70%,本次升级沿用了之前的价格策略 [2] 产品化与生态构建 - Sora 2推出了独立的iOS App应用,首页以信息流呈现优质生成作品,支持用户浏览、分享、共创,被讨论有意入局社交内容产品 [8] - 百度蒸汽机目前主要接入百度App满足内部业务需求,独立App是未来规划方向 [8] - 百度搜索于10月15日全面升级文心助手AIGC创作能力,支持AI图片、视频、音乐、播客等8种模态创作,每天有千万量级AIGC内容由用户通过文心助手创作产生 [8] 应用场景与功能 - 百度文心助手提供“长视频生成玩法”,用户可通过输入描述要求AI自动完成一部3分钟故事片的全流程制作,包括情节设计、角色塑造、场景搭建等 [10] - 文心助手集成“一句话写歌”、“MV制作”、“名场面模仿秀”等创作功能,以及超30种特效玩法模板,后续将上线音乐数字人分身功能 [10] - 百度搜索发布行业首个开放式实时互动的数字人智能体,支持用户与持证真人专家的数字分身进行1v1对话,应用于法律、情感、旅游等专业咨询场景 [10] 谷歌Veo模型更新 - 谷歌Veo 3.1版在音频输出、精细化编辑控制以及图像转视频效果方面均有提升 [5] - Veo 3.1特别推出视频扩展、首尾帧补过渡、图片引导风格控制三大升级功能 [6]
闪电快讯|Sora 2亮相后,百度谷歌同日发布视频模型新品