AI音乐生成 - 财报，业绩电话会，研报，新闻 - Reportify

AI音乐生成

搜索文档

谷歌Gemini学会了看图作曲，你的朋友圈也能拥有专属BGM了

量子位· 2026-02-19 15:03

谷歌Gemini集成Lyria 3模型推出AI音乐生成功能 - 谷歌将最新的Lyria 3模型集成到Gemini中，使其能够根据用户输入的文本或上传的照片，在几秒钟内生成包含歌词、旋律及人声演唱的完整音乐作品[1][2] - 该功能支持48kHz高保真立体声音频采样率，显著提升了生成音乐的音质[5][7] - 生成音乐的同时，系统会调用Nano Banana模型自动生成风格匹配的专辑封面，极大简化了从创意到成品的流程[3][4][15] AI音乐生成功能的具体特性与能力 - 功能可根据用户上传的照片内容（如森林徒步）生成契合场景氛围的音乐（如民谣），为静态图像赋予声音[7] - 支持通过简单的文字提示（如“怀旧非洲节拍”）生成包含押韵歌词的完整歌曲，人声合成效果自然[10][11] - 能够生成多种音乐风格，例如1970年代的摩城灵魂乐、惆怅空灵的流行音乐，乃至纯人声伴奏的曲目[12][13][14] - 支持跨语言创作，Lyria 3首发支持韩语、日语、德语等八种语言，方便用户生成K-pop或日系风格音乐[15] 谷歌构建“超级入口”的产品与生态战略 - 谷歌旨在通过Gemini打造一个包揽所有数字生活的“超级入口”，其战略是All In式的深度整合[16][18] - 在产品层面，谷歌已打通网盘、相册、YouTube等核心资产；在模态层面，Lyria 3的加入使Gemini的多模态能力拼图更加完整[16] - 通过将创作功能深度绑定在单一应用内，用户无需在不同APP间跳转，这种全场景覆盖和便捷性构成了竞争壁垒，降低了用户使用独立工具的动力[16][17]

Software & Internet

Nano Banana模型

Software & Internet

Nano Banana模型

自由量级正式上线音潮V3.0

中国经营报· 2026-02-12 23:47

公司产品发布与技术突破 - 自由量级于2月12日正式推出音乐大模型“音潮V3.0”版本 [1] - 此次迭代完成了从“编码—生成—解码”的全链路技术重构，实现了音乐性与良品率的双重突破 [1] - 模型通过引入双轨建模与多阶段强化学习，大幅提升了歌曲的演唱质量，学会了哼唱、转音、气声等细腻技巧并拥有充沛的情感表达力 [1] - 模型在旋律悦耳度与记忆性上实现质变，生成的旋律线条更流畅，音符间张力起伏更具设计感，几乎每条旋律都拥有值得被记忆的Hook（记忆点） [1] - 音潮V3.0在编曲多样性与音乐整体性上实现显著增强，从乐器音色选择到段落间的起承转合，整体性得到极大提升 [2] - 模型为相位和混响独立建模并应用到整体生成链路，以重塑声音的物理质感，能呈现电吉他失真时的颗粒感、鼓点的空气震动及混音中的空间残响 [2] 公司战略与行业趋势 - 自由量级CTO姜涛表示，模型迭代的出发点始终关注用技术大幅降低音乐创作门槛，每一项技术重构和突破都最终指向让“音乐平权”从理念落地为现实 [2] - 公司有行业预判：2026年伊始AI音乐赛道正迎来从“野蛮生长”到“专业进阶”的关键转折 [1] - 行业正从“能生成音乐”向“生成好听、有温度的音乐”深度进化，多家国内外音乐模型相继完成技术升级 [1] - 在AI音乐生成领域，仅仅增加参数规模已不再是竞争的核心，行业不再满足于让机器一味效仿声音波形，而是试图让它理解声音背后的物理空间与情感逻辑 [1]

人工智能音乐

人工智能音乐

174亿，黄仁勋又投出一家AI独角兽

36氪· 2025-11-20 15:38

融资与估值 - 公司完成2.5亿美元（约合人民币17.77亿元）C轮融资，由Menlo Ventures领投，NVentures、Hallwood Media、光速创投及Matrix参投 [1] - 公司估值达到24.5亿美元（约合人民币174.15亿元），较2024年5月的5亿美元（约合人民币35.54亿元）估值增长近五倍 [1] - 公司年收入已达2亿美元（约合人民币14.22亿元） [1] 产品与技术进展 - 公司专注于AI音乐生成，其Suno模型可根据文字描述直接生成包含人声、歌词、编曲、混音的完整歌曲 [3] - 最新v5版本模型宣称彻底解决AI人声机械感，提升音频动态响度与声场空间感，执行复杂指令成功率可达90% [3] - 推出首款生成式音频工作站Suno Studio，结合专业多轨编辑与生成式AI，支持上传采样、调用素材库，并兼容任意专业音乐制作软件 [3] 行业动态与法律环境 - 公司及另一家AI音乐平台Udio面临环球音乐集团、华纳音乐集团和索尼音乐集团的诉讼，被指控在模型训练中抓取受版权保护的音乐 [7] - 环球音乐与Udio已达成和解，将合作推出基于授权歌曲训练的新AI音乐平台，新订阅服务计划于明年推出 [7] - 公司回应诉讼称其技术旨在创造新内容而非复制现有内容 [7] 市场影响与公司愿景 - AI音乐生成降低了创作门槛，AI生成音乐已登上Billboard电台榜单，AI歌手Xania Monet曾登顶R&B单曲销售榜 [8] - 公司目标是为普通人提供互动音乐工具，认为音乐的未来将更广阔，更多人将参与其中 [8]

AI Music Generation

AI Music Generation

4个金融男搞音乐，1年赚超1亿美元

虎嗅APP· 2025-11-06 21:17

公司概况与市场定位 - Suno被视为音乐界的"ChatGPT"，是一家专注于AI音乐生成的初创企业[2] - 公司核心突破在于能一次性生成包含歌词、人声、伴奏的完整歌曲，将音乐创作门槛从"需要数年专业训练"降低到"只需要想象力"[6] - 在高质量音频生成这一尚未被充分开发的空白市场中，Suno填补了市场空白[6][10] - 音乐生成是小众赛道，国内专家数量极少，该领域人才兼具音乐与算法专业知识[9] 融资进展与估值表现 - 自2022年成立以来共融资1.25亿美元，2024年5月B轮融资后估值达5亿美元[12] - 2024年10月正洽谈新一轮1亿美元融资，估值预计飙升至20亿美元，是上一轮估值的4倍[3][12] - 公司成为增长最快的人工智能公司之一，估值在5个月内翻了两番[12][13] 用户增长与运营数据 - 上线8个月用户突破1000万，而Spotify达到1000万用户用了4年[12] - 截至2024年中，已有超过1200万人尝试使用Suno进行音乐创作[13] - 平台平均每秒产生10首新曲目，当前年经常性收入（ARR）已超1亿美元[13] 产品功能与技术演进 - 核心产品为文本到音乐生成平台，用户输入描述性文本即可在几十秒内生成完整歌曲[15] - 2024年7月推出iOS移动应用，支持录制环境声并融入创作，实现"随手采样、即兴创作"[15] - 提供"添加伴奏"和"添加人声"工具，用户可对初步曲段进行进一步编辑[16] - 模型迭代迅速，V5版本在音质、乐器清晰度和人声真实感上实现巨大提升，人声自然度被形容为"几乎与真人无异"[16] - 2024年9月发布桌面应用Suno Studio，集成多轨编辑功能，支持将音轨导出为音频或MIDI文件，标志着专业性达到全新高度[18] 用户群体与商业模式 - 采用订阅增值模式，最高档Premier会员可独享最新模型版本及Suno Studio[19] - 目标用户为普罗大众，而非仅服务少数专业人士，定位是面向所有人的创意工具[19] - 核心用户包括大众娱乐用户、内容创作者和营销人员，后者对无版权风险的定制音乐有巨大刚性需求[19][20] - 也吸引专业人士使用，格莱美获奖制作人Timbaland每天花10小时使用Suno进行创作探索[21] 创始团队背景 - 由四位联合创始人于2022年在美国剑桥创立，团队成员曾共事于金融AI公司Kensho[23] - 创始人多为哈佛大学高学历背景，CEO Mikey Shulman为哈佛博士，团队组合为"终身音乐人+技术极客"[27] - 在Kensho处理金融音频数据时意识到音频AI技术落后，并开始探索AI音乐创作可能性[27][28] - 首个公开项目为开源文本转音频模型Bark，在收到用户强烈音乐创作需求后，将公司战略全面转向音乐生成[29] 行业竞争格局 - 全球数字音乐产业2023年产值超260亿美元，AI生成音乐现已占每日上架曲目的28%[32] - Deezer平台每日收到的AI原创曲目从2023年初的1万首飙升至10月的3万首[33] - Suno是2018年以来极少数引发轰动的音乐科技创业公司，被视为行业进入新创新周期的标志[33] - 竞争对手包括美国AI音乐平台Udio（2024年初获1000万美元融资）、更早期的Boomy（2021年获500万美元投资）以及印度的Beatoven等[35][36] - 科技巨头如谷歌展示MusicLM模型，Meta推出开源MusicGen模型，OpenAI据报内部正开发AI音乐平台[34] 版权挑战与行业动态 - Suno面临全球三大唱片公司（索尼、环球、华纳）的联合诉讼，指控其未经授权使用版权音乐训练模型[37] - 尽管诉讼激烈，但Suno正与包括环球和华纳在内的唱片公司进行授权协议谈判，内容可能涉及股权投资[37] - 环球音乐集团首席执行官重申愿意与尊重版权的AI公司合作开发产品[33]

Suno的AI音乐生成服务

Suno的AI音乐生成服务

我们大胆做了个决定，大会所有音乐bgm由AI生成，这部分预算可以省了！｜Jinqiu Scan

锦秋集· 2025-11-03 16:13

大会主题与目标 - 首届CEO年度大会以“Experience with AI”为主题，探讨科技、资本与创造力在AI时代的融合[1] - 大会目标不仅是对话AI，更是构建一个让AI被理解、使用和体验的真实场域[1] AI音乐工具选型与评估 - 2025年8月对7款AI音乐生成产品进行横评，包括Suno、ElevenLabs、Udio、字节跳动“海绵音乐”、腾讯音乐娱乐集团“TME Studio”等[4] - 评估结果显示ElevenLabs、Udio与Suno是当时产出结果较好的三款产品[5] - 最终选择Suno作为大会音乐生成工具，因其被认为成功率最高[6] AI音乐制作流程与实践 - 制作流程分为嘉宾上场串场音乐和暖场音乐储备两大需求[7][8] - 由于团队不擅长音乐，首先使用ChatGPT生成精确的音乐制作Prompt[10] - 以宇树科技CEO上场音乐为例，Prompt要求兼具科技感与思辨氛围，包含细微机械呼吸声与柔和低频，节奏平稳且空间感强[11] - 暖场音乐根据议程设计分为三类风格：节奏感强的“热烈的”、温润电子氛围的“平静的”、以及弦乐渐入的“收束的”[21] - 每个暖场环节制作了10-20首音乐作为储备[20] AI音乐生成能力评估 - AI当前能做到风格模仿和结构生成，能根据“未来感”、“工业感”等关键词快速生成符合语义的音乐片段[26] - AI的局限性在于缺乏对语义的深层理解，无法把握音乐在特定场景中承担的“情绪转场”作用[26] - 音乐创作门槛降低，但情绪设计的门槛升高，需要理解场景节奏和品牌声音气质[26] 挑战与优化方向 - 主要挑战在于Prompt表达的精准度，模糊词汇如“未来感”会导致输出千篇一律[27][28] - 今年主要依赖单一模型（Suno）通过反复生成筛选最优版本[30] - 明年优化方向包括结合Suno、Udio、Mureka等多模型负责不同音乐风格或段落[30] - 未来展望包括尝试音乐与舞台效果的同步生成，以及基于现场实时情绪反馈的AI音乐生成[30]

OpenAI进军音乐模型！

智通财经网· 2025-10-26 11:46

OpenAI音乐模型开发现状与规划 - 公司正积极开发AI音乐模型工程师与茱莉亚音乐学院学生合作进行乐谱标注作为训练数据[1] - 模型将利用文本和音频提示词生成音乐例如为现有声乐曲目添加吉他伴奏[1] - 功能旨在降低内容创作门槛用户可为Sora生成的视频即时配乐并分享至社交平台[1] - 音乐模型将帮助公司构建更全面AI生态系统提升超过8亿活跃用户的黏性[1] - 模型具体整合方式尚未确定可能无缝结合ChatGPT或Sora 也可能成为独立应用[1] - 模型具备商业化潜力广告公司可用其创作广告歌词和旋律助力公司向广告领域拓展[1] OpenAI音乐领域技术积累 - 公司早在2019年便推出音乐生成模型MuseNet 可结合10种乐器音色生成4分钟多种风格乐曲[2] - 2020年发布会唱歌的Jukebox模型[2] - 但历史模型均未被整合进ChatGPT和Sora 因技术及计算成本限制生成音乐与人类创作仍有差距[2] 全球AI音乐行业竞争格局 - 音乐生成技术因算力和模型架构进步迎来实用化成为文本与视频后的新一轮AI竞赛焦点[3] - 谷歌于今年5月推出第二代音乐制作模型Lyria 同样强调为广告制作配乐的功能[3] - 初创公司Suno和Udio已实现商业化 Suno年经常性收入达1.5亿美元较一年前增长近四倍[3] - 中国AI音乐模型迅速崛起包括字节跳动Seed-Music 阿里InspireMusic 昆仑万维Mureka O1 腾讯SongGeneration等[3] - MiniMax于9月12日上线Music1.5模型实现强控制力人声自然编曲丰富结构清晰四大突破[4]

Artificial Intelligence

Artificial Intelligence

MiniMax上线新一代音乐生成模型可生成整首歌曲记者实测

新京报· 2025-09-14 14:41

产品发布与技术规格 - 公司上线新一代音乐生成模型Music1 5 [1] - 模型在音乐生成时长、控制精度、编曲表现等多个维度实现显著提升 [1] - 模型支持长达4分钟的音乐创作，出品即成品 [4] 功能与性能提升 - 简单模式下用户仅需几个关键词或一句自然语言描述即可生成高完成度歌曲 [4] - 高级模式下用户可以定义不同段落歌词的编排 [4] - 生成的AI曲目时长达到3分6秒，结构完整包含前奏、主歌、副歌和收尾 [1][3] 技术突破与音质表现 - 模型对人声唱腔发音技巧进行深度建模，可生成不同声线、唱腔的音色 [4] - 生成的音色更具通透感和真实感，音色自然饱满，转音顺畅无断层 [4] - 该技术突破解决了此前AI生成音乐中人声机械化、缺乏情感表达的问题 [4]

昆仑万维正式上线Mureka V7

证券日报网· 2025-07-23 20:40

产品发布 - 公司正式上线最新音乐模型MurekaV7和音频模型MurekaTTSV1 [1] - MurekaV7大幅提升旋律动机与编曲质量，增强人声与乐器真实度，并提高音乐创新性 [1] - MurekaTTSV1支持VoiceDesign能力，用户可通过文本输入获得想要的语音特征音色 [2] 技术优化 - MurekaV7优化了MusiCoT技术，专为音乐生成设计链式思维提示方法 [1] - MusiCoT技术在生成音频前先引导模型生成全局音乐结构规划，明确段落、情绪、编配等布局 [1] - 结合CLAP模型，MusiCoT构建出具备明确语义指向的"音乐思维链"，提升复刻、变奏等创作需求的灵活性 [2] 用户与市场反馈 - 此前发布的MurekaO1与MurekaV6模型自3月底以来新增注册用户近300万 [1] - MusiCoT技术在主观与客观双重指标下均展现出卓越效果，结构完整性、旋律连贯性和整体音乐性优于传统方法 [2] 未来规划 - 公司将持续迭代MusiCoT技术，进一步提升AI音乐生成的创意性与工业化能力 [2]

昆仑万维(SZ:300418)