谷歌(GOOGL.US)Gemini解锁付费新技能，照片转视频功能全面开放

产品发布与功能更新 - 谷歌母公司Alphabet宣布面向付费用户开放"照片转视频"功能，该功能年初仅限小范围测试，现正式登陆Gemini人工智能助手 [1] - 自周四起，特定地区订阅Google AI Ultra和Pro计划的用户可通过Gemini网页版使用该功能，移动端应用将在本周内陆续推送更新 [1] - 新功能允许用户基于单张照片及文本描述生成带声音的8秒短视频，生成的MP4格式视频分辨率为720p，采用16:9横向画幅 [1] - 该功能由谷歌五月发布的最新一代视频生成模型Veo 3驱动，此前仅限通过独立付费影视工具Flow使用 [1] 市场竞争格局 - 此次更新使该功能直接集成至Gemini聊天界面，标志着谷歌在AI视频领域与美国竞争对手OpenAI、Runway AI Inc保持同步 [1] - 全球市场竞争激烈，中国阿里巴巴集团、AI初创企业Manus和快手科技过去数月均发布了升级版视频工具 [1] 技术实现与限制 - 测试显示技术仍存缺陷，上传个人照片要求生成人物讲话视频时，输出结果多次改变面部特征甚至人种 [2] - 能成功实现"植物随风摆动"或"静态猫片说话"等简单指令，但对"照片人物跳霹雳舞"等复杂要求，仅生成人物挥手画面 [2] - 谷歌发言人回应称AI模型并无修改人物外貌的设定指令，照片转视频及面部动画仍属新技术，可能基于单张图像生成与原始内容不符的结果 [2] - 模型更擅长活化其他场景，如日常物品动画化、画作动态化及自然照片增运动效果 [2] 内容安全措施 - 谷歌强调已采取"重要后台措施确保视频生成符合规范"，禁止使用公众人物(包括名人、政要及知名企业家)图像生成视频 [1] - 政策同时禁止煽动危险行为、暴力或群体攻击的内容 [1]