谷歌也要「AI抖音」了!新Veo 3.1原生支持竖屏,4K分辨率高画质
量子位·2026-01-14 16:10

谷歌Veo 3.1模型升级核心要点 - 谷歌Veo 3.1模型进行了重要更新,核心升级方向为竖屏4K画质,标志着公司正式进军AI短视频领域 [1][2][11] - 此次更新虽被官方视为小幅升级,但具备重大意义,旨在满足移动端短视频需求并提升用户体验 [9][10][12] 技术功能与性能提升 - 首次原生支持9:16竖屏视频,专为移动端短视频平台优化,无需裁剪 [15] - 在原有720p基础上,新增4K分辨率,此前最高为1080p [15] - 创意能力提升:即使提供简单提示词和参考图片,模型也能生成各种小剧场 [13][14] - 一致性大幅改进:包括角色一致性(如人物在不同场景中保持相同外观)和背景与物体一致性(保持场景物体在多个镜头中的完整性) [16][26] - 元素融合能力大幅改善:可将多张图片中的角色、物体、纹理和风格化背景自然融合成连贯视频 [20][21] 应用场景与用户反馈 - 功能已面向所有谷歌用户推出,普通消费者可通过YouTube Shorts、YouTube Create及Gemini应用体验 [23][24] - 企业或专业用户可通过Flow、Gemini API、Vertex AI和Google Vids等平台使用 [25] - 用户实际生成案例显示效果良好,包括角色一致性故事、虚拟偶像组合及AI动漫制作 [26][29][30] 行业趋势与竞争格局 - AI视频正在进入竖屏时代,谷歌并非首家,OpenAI和迪士尼等公司已先行布局 [33][34] - OpenAI曾推出独立Sora应用(被视为“AI版抖音”),但其用户留存率数据显示从首日10%降至第7日2%、第30日1%,分析认为OpenAI在运营方面面临挑战 [35][36][37] - 谷歌拥有全栈运营能力平台闭环优势,包括YouTube这一成熟的视频内容运营系统,Veo竖屏视频可直接适配YouTube Shorts,有利于形成“创作—分发—反馈—优化”的正向循环 [37][38] - 迪士尼计划在Disney+引入竖屏内容信息流,并与OpenAI合作引入视频生成能力,进一步印证竖屏模式的重要性 [40][41][42] - 国内AI玩家如可灵AI、Vidu AI等也已进行类似短视频生成的尝试 [44][46]