谷歌Gemini学会了看图作曲，你的朋友圈也能拥有专属BGM了

谷歌Gemini集成Lyria 3模型推出AI音乐生成功能 - 谷歌将最新的Lyria 3模型集成到Gemini中，使其能够根据用户输入的文本或上传的照片，在几秒钟内生成包含歌词、旋律及人声演唱的完整音乐作品[1][2] - 该功能支持48kHz高保真立体声音频采样率，显著提升了生成音乐的音质[5][7] - 生成音乐的同时，系统会调用Nano Banana模型自动生成风格匹配的专辑封面，极大简化了从创意到成品的流程[3][4][15] AI音乐生成功能的具体特性与能力 - 功能可根据用户上传的照片内容（如森林徒步）生成契合场景氛围的音乐（如民谣），为静态图像赋予声音[7] - 支持通过简单的文字提示（如“怀旧非洲节拍”）生成包含押韵歌词的完整歌曲，人声合成效果自然[10][11] - 能够生成多种音乐风格，例如1970年代的摩城灵魂乐、惆怅空灵的流行音乐，乃至纯人声伴奏的曲目[12][13][14] - 支持跨语言创作，Lyria 3首发支持韩语、日语、德语等八种语言，方便用户生成K-pop或日系风格音乐[15] 谷歌构建“超级入口”的产品与生态战略 - 谷歌旨在通过Gemini打造一个包揽所有数字生活的“超级入口”，其战略是All In式的深度整合[16][18] - 在产品层面，谷歌已打通网盘、相册、YouTube等核心资产；在模态层面，Lyria 3的加入使Gemini的多模态能力拼图更加完整[16] - 通过将创作功能深度绑定在单一应用内，用户无需在不同APP间跳转，这种全场景覆盖和便捷性构成了竞争壁垒，降低了用户使用独立工具的动力[16][17]