谷歌Gemini学会了看图作曲,你的朋友圈也能拥有专属BGM了
谷歌Gemini集成Lyria 3模型推出AI音乐生成功能 - 谷歌将最新的Lyria 3模型集成到Gemini中,使其能够根据用户输入的文本或上传的照片,在几秒钟内生成包含歌词、旋律及人声演唱的完整音乐作品[1][2] - 该功能支持48kHz高保真立体声音频采样率,显著提升了生成音乐的音质[5][7] - 生成音乐的同时,系统会调用Nano Banana模型自动生成风格匹配的专辑封面,极大简化了从创意到成品的流程[3][4][15] AI音乐生成功能的具体特性与能力 - 功能可根据用户上传的照片内容(如森林徒步)生成契合场景氛围的音乐(如民谣),为静态图像赋予声音[7] - 支持通过简单的文字提示(如“怀旧非洲节拍”)生成包含押韵歌词的完整歌曲,人声合成效果自然[10][11] - 能够生成多种音乐风格,例如1970年代的摩城灵魂乐、惆怅空灵的流行音乐,乃至纯人声伴奏的曲目[12][13][14] - 支持跨语言创作,Lyria 3首发支持韩语、日语、德语等八种语言,方便用户生成K-pop或日系风格音乐[15] 谷歌构建“超级入口”的产品与生态战略 - 谷歌旨在通过Gemini打造一个包揽所有数字生活的“超级入口”,其战略是All In式的深度整合[16][18] - 在产品层面,谷歌已打通网盘、相册、YouTube等核心资产;在模态层面,Lyria 3的加入使Gemini的多模态能力拼图更加完整[16] - 通过将创作功能深度绑定在单一应用内,用户无需在不同APP间跳转,这种全场景覆盖和便捷性构成了竞争壁垒,降低了用户使用独立工具的动力[16][17]