谷歌也要「AI抖音」了！新Veo 3.1原生支持竖屏，4K分辨率高画质

谷歌Veo 3.1模型升级核心要点 - 谷歌Veo 3.1模型进行了重要更新，核心升级方向为竖屏和4K画质，标志着公司正式进军AI短视频领域 [1][2][11] - 此次更新虽被官方视为小幅升级，但具备重大意义，旨在满足移动端短视频需求并提升用户体验 [9][10][12] 技术功能与性能提升 - 首次原生支持9:16竖屏视频，专为移动端短视频平台优化，无需裁剪 [15] - 在原有720p基础上，新增4K分辨率，此前最高为1080p [15] - 创意能力提升：即使提供简单提示词和参考图片，模型也能生成各种小剧场 [13][14] - 一致性大幅改进：包括角色一致性（如人物在不同场景中保持相同外观）和背景与物体一致性（保持场景物体在多个镜头中的完整性） [16][26] - 元素融合能力大幅改善：可将多张图片中的角色、物体、纹理和风格化背景自然融合成连贯视频 [20][21] 应用场景与用户反馈 - 功能已面向所有谷歌用户推出，普通消费者可通过YouTube Shorts、YouTube Create及Gemini应用体验 [23][24] - 企业或专业用户可通过Flow、Gemini API、Vertex AI和Google Vids等平台使用 [25] - 用户实际生成案例显示效果良好，包括角色一致性故事、虚拟偶像组合及AI动漫制作 [26][29][30] 行业趋势与竞争格局 - AI视频正在进入竖屏时代，谷歌并非首家，OpenAI和迪士尼等公司已先行布局 [33][34] - OpenAI曾推出独立Sora应用（被视为“AI版抖音”），但其用户留存率数据显示从首日10%降至第7日2%、第30日1%，分析认为OpenAI在运营方面面临挑战 [35][36][37] - 谷歌拥有全栈运营能力和平台闭环优势，包括YouTube这一成熟的视频内容运营系统，Veo竖屏视频可直接适配YouTube Shorts，有利于形成“创作—分发—反馈—优化”的正向循环 [37][38] - 迪士尼计划在Disney+引入竖屏内容信息流，并与OpenAI合作引入视频生成能力，进一步印证竖屏模式的重要性 [40][41][42] - 国内AI玩家如可灵AI、Vidu AI等也已进行类似短视频生成的尝试 [44][46]