Workflow
AI音乐
icon
搜索文档
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 21:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
音乐极客的平权实验:他想在写歌上再造一个快手
虎嗅· 2025-08-25 11:26
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 实现AI与音频首次结缘[4] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》 此后数十年间AI音乐发展缓慢 马尔可夫链 循环神经网络和卷积神经网络等技术难以突破全链条生成门槛[5] - 2016年谷歌推出Magenta项目 利用深度学习框架展示AI音乐生成能力 成为行业重要里程碑[6] - 2024年Suno横空出世 首次实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界"ChatGPT"[7] 音潮公司核心战略 - 公司致力于实现"音乐平权" 让每个人都能用音乐记录生活 目标重塑音乐行业和IP生态[35] - 产品采用B端开放API接口与C端按首收费相结合商业模式 C端用户可免费创作4首歌 超过部分需付费 儿童音乐教育和AI教育场景完全免费[51] - 通过自建国内最大音乐数据标注库构建数据壁垒 与上海音乐学院建立联合实验室 由数十名学生参与数据标注工作[52] - 移动端产品每三周迭代一次 网页端每两周迭代一次 持续增加新功能激发用户创作热情[38][47] 技术演进与突破 - 2016年深度学习技术突破解决人声与伴奏分离行业难题 采用医疗影像血管分离模型应用于语谱图分析 效果显著提升[6][11] - 2021年Transformer架构大模型出现 2024年实现端到端音乐生成 模型训练数据达到千万首时出现"智力涌现"现象 质量突飞猛进[7][36] - 使用国产芯片进行训练和推理 采用训推一体化方案降低成本 推理请求量大时将训练机器转为推理使用[48] 市场竞争格局 - 国内AI音乐研究人员屈指可数 算法圈人员分布呈现自然语言处理最多 计算机视觉次之 音频相关最少的格局 音乐生成领域专家不足10人[13][14] - Suno专注于专业音乐人生产工具和流媒体平台 Riffusion采用GPT聊天方式创作音乐 Eleven Labs在语音合成领域领先并推出音乐API[41][59][70] - 腾讯AudioGenie专注于视频和图像配音效 多模态能力突出但非完整音乐作品生成[49] 用户获取与留存策略 - 目标用户首先锁定学生群体 因其思维活跃 接受新事物能力强 使用频率和时间充足[45] - 通过"音果"功能实现歌曲要素混合创作 建立"音缘"社交关系 游戏化创作过程增强用户粘性[43] - 提供IP养成和收益分成机制 用户可通过播放量获得收益 版权完全归用户所有[51][53] 资源投入与成本控制 - 训练推理采用国产芯片方案 性价比显著 通过动态资源调配降低运营成本[48] - 团队每月投入200-300美元测试新兴AI产品 包括可灵 即梦 PixVerse等视频生成工具 保持技术敏感度[68][69] - 依托世界人工智能大会宣传获得数十万注册用户 通过高频迭代维持用户活跃度[65]
网易云音乐(09899):25H1业绩点评:订阅增长稳健,利润超预期系销售费用收缩
光大证券· 2025-08-16 15:07
投资评级 - 维持"买入"评级 [4][5] 核心观点 - 报告公司1H25收入略低于预期(38.3亿元人民币,同比-6%),但利润超预期(经调整归母净利润19.5亿元,同比+121%),主要受益于销售费用收缩及递延所得税抵免8.5亿元 [1] - 在线音乐服务收入增长稳健(29.7亿元,同比+15.9%),社交娱乐收入下滑(8.6亿元,同比-43.1%)因直播入口关闭 [2] - 订阅收入同比增长15.2%至24.70亿元,非订阅收入同比增长20%至4.98亿元 [2] - 毛利率提升1.4pct至36.4%,销售费用同比下降55.8%至1.63亿元 [1][3] 业务表现 在线音乐服务 - 版权与自制并进:新增RBW、Starship等K-POP厂牌资源,引入李健/张艺兴/陈楚生等华语曲库,与王嘉尔合作提升流量变现力 [2] - 独立音乐人生态:注册独立音乐人超819000名,上传曲目约480万首 [2] - 产品创新:推出神光播放器、AI帮唱等功能,DAU/MAU稳定在30%以上 [3] 财务表现 - 1H25营业利润8.45亿元(同比+40.8%),剔除递延税项影响后经调整归母净利润约11亿元 [1] - 研发费用同比下降4.2%至3.79亿元,管理费用同比+3.6%至9300万元 [3] - 现金流改善:1H25经营活动现金流28.4亿元,投资活动现金流-7.43亿元 [10] 盈利预测 - 上修2025年经调整归母净利润预测至29.4亿元(较前次+55%),2026-2027年预测分别上调至25.9/28.6亿元(+19%/+17%) [4] - 2025E营业收入预计78.37亿元(同比-1.4%),2026E/2027E增速分别为8.2%/11.6% [5][10] - 经调整EPS 2025E为13.51元,对应P/E 18倍 [5] 市场数据 - 当前股价270.2港元,总市值588.49亿港元 [6] - 近1年股价涨幅198.6%,3个月涨幅32.8% [8] - 总股本2.18亿股,近3月换手率49.9% [6]
自由量级「音潮」音乐大模型独立全栈完成WAIC 2025大会主题曲,无词曲作者
IPO早知道· 2025-07-26 20:58
全链路自研技术 - "音潮"音乐大模型采用AR+NAR架构,具备多模态表征能力和创新重建模型,可高保真重建音乐信号并独立建模音乐特征,解决传统方案的音乐细节丢失问题 [2] - 研发Diffusion Transformer(DiT)模型,通过独特注意力机制同步左右声道差异,生成具有真实声场空间的沉浸式音频 [2] 全新功能"音果" - "音果"功能实现多首歌曲的曲风、情绪、音色等融合再创作,支持超参数调节以控制融合比例 [4] - 支持跨模态输入(文字/图片/视频),系统自动联合音频特征生成场景化专属音乐 [4] - 单首歌曲生成成本低于市场同类产品的五分之一,显著提升效率与成本优势 [6] 产品定位与行业影响 - 目标为音乐人提供可控、高保真、低门槛的生成式工具,推动中国AI音乐技术进入国际一线阵营 [5] - 打破音乐创作技术门槛与资源垄断,形成创作者-用户-平台多方共赢的生态系统 [5] - 版权归属用户,通过生成记录和账户身份生成唯一创作凭证,保障音乐人收益 [6] AI原生设计智能体PI - PI(Presentation Intelligence)通过意图理解、多智能体协作引擎和原生多模态编辑器构建全栈智能体Co-pilot系统 [8] - 支持从内容大纲到设计布局的全流程AI原生创作,实现唯一性专属设计 [9] - 强调人机和谐共赢与学习迭代价值观,支持动态平衡调节的协作环境 [10] 技术愿景 - PI定义"AI原生设计智能体"新品类,以AGI重塑未来交互,释放人类深层创造力 [11] - "音潮"与PI共同推动AI技术在内容创作领域的范式革新,覆盖音乐与设计多场景 [11]
用户暴涨近300万,国产AI音乐神器Mureka重磅升级V7,我们拿它复刻了「印度神曲」
机器之心· 2025-07-23 16:57
AI音乐生成技术发展 - AI音乐生成技术已实现高度拟真,部分作品在网易云音乐获得15万点赞,但仍有音质糊、人声失真等可识别特征[4] - 行业呈现加速进化态势,AI音乐作品正从"牙齿漏风"向"真假难辨"快速迭代[4][5] - 昆仑万维Mureka V7成为当前国产最强音乐大模型,在平均表现评分(57.7%)、人声真实感(70%)等关键指标超越海外竞品Suno V4.5[6][8] Mureka V7技术突破 - 相比前代V6实现全面升级:旋律动机质量从59.5%提升至72%,编曲质量从41%提升至51.5%,人声真实感从48.5%跃升至70%[7][8] - 创新性推出"自定义歌手"功能,可基于音频/视频链接模仿特定音色(如成功复现王菲空灵声线与气声唱法)[12][16] - 新增自动MV生成能力,支持土味风格视频创作,包含黄色描边歌词等特色元素[20] 核心技术MusiCoT - 采用音乐思维链技术(MusiCoT)实现三大创新:先规划结构后生成(符合人类创作逻辑)、生成结构可解释可控、主客观验证效果全面领先[27][28][32] - 通过CLAP模型实现音乐风格的可控输入,支持任意长度参考音频作为提示[31] - 技术升级推动生成作品结构完整度提升71%,旋律连贯性优化59%,达到行业顶流水准[33][34] 商业化应用场景 - 面向普通用户:支持文字Prompt生成免版权BGM(如"回忆童年的温暖钢琴旋律"),大幅降低创作门槛[23] - 面向专业音乐人:生成作品可提供创作灵感,加速从灵感到成品的转化过程[35] - 新增Mureka TTS V1音频模型,语音质量超越ElevenLabs TTS V2,支持通过文本定义音色特征(如12岁女童音、新闻播音员等)[37][44] 行业竞争格局 - 垂直领域大模型(音乐/视频)成为技术博弈新焦点,各厂商加速抢占AIGC商业化落地场景[48] - 昆仑万维形成"基础研究-基座模型-产品矩阵"全产业链,Mureka系列新增用户近300万[49][51] - 行业呈现从基础模型竞赛向垂直应用转型的趋势,音乐创作正向"全民表达"方向发展[47][52]
手把手教你用最新的AI音乐模型,创造一首属于你自己的歌。
数字生命卡兹克· 2025-07-23 16:43
昆仑万维AI音乐模型Mureka v7 - 公司推出新音乐模型Mureka v7,质量对标Suno 4.5,是国内领先的AI音乐产品 [1] - 模型提供v6、v7和o1三个版本,o1为专业级推理模型,v6/v7面向普通用户 [54][55][56] - 生成成本:o1每次10积分(两首歌),v7每次2积分(两首歌),积分制定价约几毛钱/首 [63][64][66] AI音乐创作方法论 - 歌曲结构为核心骨架,需包含前奏、主歌、预副歌、副歌、间奏、桥段、尾奏等标准化元素 [19][32][33] - 提供歌词生成模板,涵盖风格、情感基调、主题内容、结构要求等六大维度,支持OpenAI联网优化创作 [36][38] - 提示词模板可自动生成300字以内的风格描述,包含流派、情绪词、BPM等关键参数 [50][52] 产品功能与用户体验 - 支持视频链接直接解析参考,简化音频提取流程 [44] - 多语言生成能力覆盖国语、粤语、日语等 [70] - 用户实测400积分可生成大量作品,剩余322积分时已创作多首主题曲 [68][69] 版权与商业化优势 - 提供下载权属证明证书,解决AI音乐版权归属问题 [74][75] - 版权政策优于Suno,用户永久保留作品所有权 [73] - 产品定位降低音乐创作门槛,实现普通人专属歌曲创作 [79][81] 行业技术演进 - AI音乐从早期SVC合成发展到全流程大模型生成 [77][78] - 模型迭代显著提升音乐质量,消除明显AI痕迹 [12][78] - 国产模型突破实现与国际竞品(Suno)对标能力 [1][79]
AI时代的荒诞叙事:当音乐人不再是“人”
36氪· 2025-07-15 18:10
AI音乐人兴起 - 一批AI生成音乐人在Spotify等平台迅速蹿红 其形象、人设、封面及音乐均由AI工具生成 与人类创作者形成直接竞争[1][3] - 代表性案例包括乡村歌手Aventhis 三个月内发布3张专辑共57首歌曲 月度听众峰值达107万 目前保持99.1万 代表作《Mercy On My Grave》Spotify播放量超200万 YouTube播放量达161万[4] - 另一AI乐队The Devil Inside月度听众峰值近70万(当前52万) 代表作《Bones In The River》播放量超180万 并已推出官方周边商品[5][6] - AI乐队The Velvet Sundown在Spotify拥有114万月度听众 平台为其创建专属歌单 官网出售49款周边商品 单品最高售价超60美元[6] 平台推荐机制与商业化 - Spotify通过算法将AI音乐人植入官方歌单 给予平台认证和推荐 使其获得与人类创作者同等的曝光机会[3][11] - 平台"粉丝也喜欢"推荐栏中至少存在13位活跃AI音乐人 总计月度听众超410万人[11] - AI音乐人建立完整社交媒体矩阵 作品同步上线Apple Music、Amazon Music及YouTube Music等主流平台[11] - 部分AI音乐人如The Devil Inside在简介中坦承虚构属性 但多数未明确标注 导致听众难以辨别真伪[6][14][16] 技术生成与版权争议 - 技术分析显示Aventhis热门单曲《Mercy On My Grave》由Riffusion(65.9%)和Suno(26.5%)生成 AI总占比超90% 另一作品《I'm A Dead Man Walkin'》Suno占比达86.7%[19] - The Devil Inside代表作《Dust and Thunder》Suno生成比例达99.654% 近乎完全由AI创作[20] - Suno和Udio被美国大型唱片公司联合起诉 指控其训练过程未经许可使用版权音乐 两家公司以"合理使用"抗辩 正与唱片巨头秘密谈判使用权[23] - 美国版权局规定纯AI生成作品无法获得版权保护 仅人类主导表达元素的作品可获部分或全部版权 当前法律存在模糊地带[27][29] 行业影响与经济风险 - 生成式AI技术可能导致2028年音乐创作者24%收入面临风险 相当于五年累计损失100亿欧元 其中2028年单年损失达40亿欧元[31] - 2025年第一季度AI生成音乐在国内独立发行领域占比高达56.9% 主要影响生成端[33] - 主流平台如网易云音乐"天音"、酷狗音乐凌音引擎、QQ音乐TME Studio推出AI创作工具 但版权分配规则差异显著 网易云规定用户修改占比0–20%时权利全归平台[34][35] - 程序员利用AI工具生成歌曲《七天爱人》 单日版税收益超150元 并以5万元出售版权 反映低门槛变现趋势[36] 平台应对与行业立场 - Deezer平台每日AI生成曲目上传量超2万首(1月为1万首) 推出AI音乐标记系统 禁止全AI生成音乐进入算法推荐和人工歌单 并剔除对应版税结算[41][43] - 摇滚流媒体平台ROKK公开禁播AI生成音乐 允许用户举报并由人工审核下架[45] - 环球音乐集团(UMG)调研显示超七成用户看重艺术家真实身份与情感表达 强调AI应作为工具而非主角[49] - 澳大利亚制作人提议以AI反制AI 通过冒名上传分流收益 但该方案可能加剧问题[39]
首位“纯血”AI艺人诞生,虚拟偶像迎来分水岭?
36氪· 2025-06-19 18:41
虚拟偶像行业动态 - 美国制作人Timbaland推出全新AI音乐流派"A-Pop"并发布首位纯AI偶像TaTa 其首张单曲《Her》即将发行[1][3] - TaTa由AI音乐公司Stage Zero打造 该公司由Timbaland联合电影制片人Rocky Mudaliar和AI顾问Zayd Portillo于2023年6月成立[3][5] - Stage Zero采用AI音乐平台Suno的技术 通过上传Demo音频由AI生成音效和调整声音 再结合人类创作的歌词完成歌曲[5] 虚拟偶像技术演进 - 虚拟偶像发展经历三个阶段:技术文化探索阶段(1990年代)、拟人化阶段(2000年代)、多元化阶段(2020年代)[16][29] - 早期代表包括日本CG偶像伊達杏子(1995)和韩国虚拟歌手Adam(1998) 主要依赖3D建模和动作捕捉技术[17][19][29] - 突破性进展包括英国虚拟乐队Gorillaz(2000)和日本初音未来(2007) 后者采用Vocaloid技术实现用户共创内容[21][23][29] 市场发展现状 - 全球虚拟偶像市场规模预计2030年达50.3亿美元 年复合增长率18.8%[34] - 虚拟网红市场规模2024年已达60.6亿美元 预计2025-2030年保持40.8%增速[34] - 日本虚拟主播产业预计2033年达80亿美元规模 Hololive等公司推动VTuber文化主流化[34][36] 商业模式创新 - 虚拟偶像具备稳定可控特性 无违约风险 可进行虚拟演唱会、NFT联动等多元化商业开发[38][40] - AI技术大幅提升内容生产效率 Timbaland表示原本三个月的工作现在仅需两天完成[38] - 虚拟偶像可跨越不同媒介场景 形成全域营销的动态节点[40] 行业争议与挑战 - 音乐行业正与AI平台Suno、Udio谈判 涉及版权作品使用控制和协议定价问题[40][42] - AI生成内容是否构成侵权、算法能否视为创作主体等法律问题尚无定论[42] - 虚拟偶像的伦理边界和内容责任归属问题引发行业思考[44]
腾讯音乐:2024年华语数字音乐白皮书.
搜狐财经· 2025-06-01 11:09
全球与中国市场数据洞察 - 全球音乐市场收入从2023年707亿美元增长至2024年762亿美元,现场演出占比46.1%,订阅流媒体占录制音乐收入51.2% [2] - 中国录制音乐收入同比增长9.6%,在线音乐付费用户达1.8亿,腾讯音乐付费用户增至1.21亿,ARPU值提升至11.1元 [2] - 非华语音乐在华播放份额稳定在15%,英语、韩语、日语居前三,非华语新歌关注度持续上升,如《APT.》成为现象级作品 [2] - 华语新歌产量在AI技术推动下爆发,2024年达135.1万首,但年播放量<1000的歌曲数量翻倍,市场竞争加剧 [2] - 近五年歌曲贡献超60%播放份额,周杰伦等经典作品仍具生命力,年轻用户对个性化、垂类音乐需求显著 [2] 行业三大核心趋势 - **县城叙事**:下沉市场成为创作焦点,如河南说唱之神《工厂》以工业叙事引发共鸣,影视《我的阿勒泰》等通过在地视角触达主流 [3] - **银发经济**:中国60岁以上人口突破3亿,刀郎演唱会吸引半数中老年观众,线上挑战赛、广场舞曲改编等UGC内容活跃 [4] - **音乐节内容**:头部IP通过稀缺艺人(如林忆莲复出)、特别企划(限定舞台、新歌首演)及跨界融合(影视游戏IP联动)实现差异化 [5] 跨界案例:音乐与多领域融合创新 - **游戏音乐**:《黑神话:悟空》融合唢呐、陕北说书与西洋管弦乐,如Boss战曲《我也去当个天命人玩玩》改编自梵呗诵经,推动游戏内外传播共振 [6] - **音乐教育**:多邻国推出游戏化钢琴学习产品,日活达300万,清华附中引入「新声创编培养体系」探索从兴趣到专业的路径 [7] - **演出营销**:哥伦比亚「玩徒派对」整合徒步与音乐节,斑马音乐节以「精酿+摇滚」圈层策略提升品牌认知 [8] 年度作品与行业展望 - 腾讯音乐榜盘点年度十大歌手、歌曲、专辑,周深、汪苏泷、单依纯等艺人表现突出,《小美满》《暮色回响》兼具热度与专业性 [9] - 行业未来需以「跨界思维」打破圈层壁垒,拥抱技术变革,平衡内容质量与商业价值 [9] 报告背景与研究方法 - 腾讯音乐研究院依托腾讯音乐娱乐集团及行业伙伴数据,聚焦华语数字音乐行业全貌与趋势 [13][14] - 2024年报告新增「跨界」板块,探讨音乐与游戏、营销、教育等领域的融合,反映行业打破传统路径的需求 [17][19]
TME若收购喜马拉雅,能打破音频平台的规模困境吗
36氪· 2025-05-22 11:35
音频行业整合趋势 - 音频行业面临规模化挑战,免费商业模式对用户和流量吸附能力极强,可能打破市场原有规模上限[1] - 腾讯音乐计划以24亿美元收购喜马拉雅,若成功将显著扩大其在音频领域的市场份额[1] - 喜马拉雅曾四次冲击IPO未果,荔枝FM市值从上市时的6亿美元缩水至1481万美元,反映音频平台资本困境[1] 腾讯音乐的战略布局 - 腾讯音乐旗下拥有酷我音乐、酷狗音乐、QQ音乐、懒人听书,收购喜马拉雅将增强其在车载等场景的渗透能力[2] - 2024年腾讯音乐在线音乐服务收入同比增长25.5%,占总收入超75%,版权库拥有2.6亿首授权及共创音乐和音频曲目[5] - 腾讯音乐付费率为20.6%,ARPPU增速放缓,计划从增加月活转向提升用户参与度[6] 喜马拉雅的核心优势 - 喜马拉雅2023年移动端月活用户1.33亿,占中国在线音频平台移动端总收听时长的60%[11] - 平台拥有4.88亿条音频内容,覆盖459个品类,UGC生态和有声书版权是其核心壁垒[11][12] - 与比亚迪、小米等80多家主机厂合作,硬件和场景渗透能力突出[16] 行业竞争格局与挑战 - 音频直播业务受短视频平台挤压,腾讯音乐社交娱乐收入占比从56%降至23.4%[8] - 中国网络音频用户规模3.35亿,同比下滑,使用时长从2020年58分钟降至25分钟[22][24] - 免费模式在网文和短剧领域已验证成功,番茄畅听DAU达数千万,可能颠覆音频市场[25] 未来发展方向 - 腾讯音乐通过收购整合喜马拉雅,目标构建全场景声音服务体系,巩固行业头部地位[10] - AI技术可能降低音乐内容成本,减少对头部歌手依赖,带来行业变革[26] - 音频行业需规模化覆盖高内容成本,横向整合成为不可逆趋势[19]