Workflow
实测Gemini图片转视频新功能,终于蹲到经典梗图后续了(doge)
量子位·2025-07-12 12:57

产品功能 - Gemini新推出图片转视频功能,支持带音效的视频生成,官方示例为开盒子场景[1] - 生成的视频长度约7-8秒,速度约1-2分钟完成[54] - Google AI Pro会员每日有3次视频生成额度,重试也占用额度[55] 技术表现 - 生成速度普遍较快,多数案例在1分钟内完成[13][17][22][26] - 音效表现良好,但需要具体描述如"叮咚"等拟声词效果不佳[55] - 对真人形象内容有限制,无法生成具体真人形象[46][56] - 对原图理解存在局限,有时会自由发挥而非完全遵循指令[33][37] 应用场景 - 开盒子类场景效果突出,能体现未知惊喜感[5][8] - 可应用于创意内容生成如迷你音乐会、电梯场景等[20][24] - 尝试扩展应用到梗图续写但效果参差不齐[29][42][45] - 企业logo创意展示效果有限,难以实现复杂变形[51] 用户体验 - 整体使用感受良好,具有娱乐性[57] - 需要详细提示词才能生成精确内容,否则会自由发挥[57] - 对非盒子类物品如行李箱的识别能力有限[18] - 2D卡通风格处理能力尚可,能保持风格统一[27]