Workflow
Music Technology
icon
搜索文档
AI音乐进入“工业化”阶段 昆仑天工发布Mureka V8音乐大模型
新华财经· 2026-01-30 06:57
当AI能制作出完成度颇高的作品,音乐人的价值何在?资深音乐制作人闻震提出了一个清晰的"人机协 作框架":在创作流程中,从0到1的灵感和核心词曲表达(即"心里有洞"的部分)依然依赖于人;AI则 能在1到7的阶段(编曲、制作、生成多版本DEMO)中,以前所未有的效率提供高质量的基础解决方案 和多样选择;最后,专业音乐人再基于审美进行深度优化与精修,完成最后20%的升华。 "AI工具将基础工作提升到了80分。"闻震说,"这恰恰解放了音乐人,让我们能更专注于创意内核、审 美判断与情感深度的挖掘。未来的音乐人,需要提升的正是操作提示词、驾驭AI来实现独特表达的能 力。" 新华财经北京1月30日电(记者孙广见)昆仑天工于28日正式发布Mureka V8音乐大模型,并提出"好的 AI音乐是一种新的音乐品类"的核心主张。此次V8版本的发布,被昆仑天工视为一个关键的转折 点。"这是我们模型演进史上跃进最大的版本之一。"昆仑天工董事长兼CEO周亚辉指出,"它不仅是技 术能力的超越,更标志着AI音乐首次达到了大规模工业化应用的成熟度。" 这种"工业化"能力,源于底层技术的系统性进步。周亚辉解释,V8的突破建立在MusiCoT(音乐 ...
Auddia Launches Discovr Radio, Redefining Artist Discovery in Radio Streaming and Provides Update on Merger
Prism Media Wire· 2026-01-20 19:01
产品发布:Discovr Radio - 公司于2026年1月20日正式推出AI驱动的艺术家与厂牌推广平台Discovr Radio [2] - 该平台旨在通过一种新模式重新定义广播流媒体中的音乐发现 允许艺术家和厂牌在传统广告时段将音乐直接插入AM/FM流媒体内容中 [4] - 平台由公司专有的AI投放引擎驱动 能根据情境、行为和收听数据智能匹配歌曲与听众 在提供保证播放次数的同时保持无缝的听众体验 [4] - Discovr Radio已直接集成至公司的旗舰应用faidr中作为首个分发合作伙伴 faidr听众可实时对歌曲进行喜欢/不喜欢操作 访问艺术家资料并探索新音乐 且不中断收听体验 [5] - 平台包含一个专门的艺术家门户 参与的艺术家和厂牌可访问详细的性能分析、听众参与度洞察以及活动级别报告 如总播放/部分播放、跳过、喜欢/不喜欢、按地理位置和电台统计的收听情况以及每次播放成本 [6] 产品发布计划与策略 - 平台于1月20日上线 初始试点客户约为300名 随后计划每周增加新客户 [2][3] - 平台扩张速度将与公司旗舰应用faidr的整体用户增长挂钩 [3] - 初始试点阶段旨在优化平台性能 改善活动效果 并从早期客户处收集真实世界洞察 [7] - 随着faidr用户基数的持续增长 Discovr Radio将相应扩展 每周引入新的艺术家和厂牌 [7] 公司合并进展 - 公司合并讨论持续取得进展 正致力于执行最终文件 [2] - 非约束性意向书最近已延长至1月底 以便完成相关流程 [8] - 在执行具有约束力的合并协议后不久 公司将开始报告合并细节 包括提交全面的S-4表格 [8] - 此次合并旨在将公司重组为一家名为McCarthy Finney的控股公司 交易代码为MCFN McCarthy Finney将专注于向其子公司(其中之一将是Auddia)提供AI和Web3能力 [8] 公司业务与定位 - 公司是一家AI优先的技术公司 已构建专有的音频识别与分类AI平台 旨在革新消费者与音频互动的方式 [2] - 公司通过其专有的音频AI平台 不仅致力于革新消费者与AM/FM广播、播客等音频内容的互动方式 也致力于改变艺术家和厂牌推广音乐及接触主流广播听众的途径 [9] - 公司的旗舰音频超级应用faidr提供多项行业首创功能 包括:在任何AM/FM电台的无广告收听、跨任何AM/FM电台的内容跳过、一键跳过整个播客广告时段以及集成的艺术家发现体验 [11]
从冷门歌手到热门金曲,AI音乐成了?
钛媒体APP· 2025-12-11 14:37
文章核心观点 - AI音乐产业在2024年经历了从“技术试水”到“热门内容爆发”的快速发展,技术已从单一的声音模仿升级为覆盖作词、作曲、编曲、混音等全链条的“一站式创作平台”,并在消费端和商业端展现出明确的商业潜力,尽管在版权、市场接受度及技术细节上仍面临挑战 [1][2][5] AI音乐的技术演进与产业现状 - 技术实现本质飞跃:AI音乐已从2023年仅能模仿人声的“声音滤镜”式二次创作,发展为类似AI生图的“数据驱动的概率生成”模式,通过深度学习模型学习音乐结构与风格,实现从随机状态生成完整歌曲 [2] - 关键模型与平台涌现:2024年3月,Suno AI推出可制作“广播级”音乐的生成模型Suno V3,仅需几秒即可生成2分钟完整歌曲 [2] 国内方面,昆仑万维于4月发布音乐生成模型Mureka V1,8月推出商用创作平台Mureka,9月对话式音乐创作Agent Tunee开启全球公测 [4] - 工具生态“全栈升级”:专业音乐制作各环节均出现AI工具,如编曲辅助Soundraw、人声分离LaLaL.AI、音色设计Synplant2、混音套件Neutron及母带处理平台LANDR,AI音乐产业方向从单一工具进化为“一站式创作平台” [5] - 消费端应用普及:主流流媒体平台如QQ音乐、酷狗音乐已集成“AI写歌”、“AI唱”功能,用户可通过对话、文字或图片生成歌曲,或录制30秒清唱生成专属音色进行翻唱,实现了从“随时随地听”到“随手制作”的转换 [5][6] AI音乐的商业化路径与市场表现 - 海外C端市场成功变现:AI歌曲《Walk My Walk》于2024年11月登顶Billboard乡村音乐数字销售榜榜首,其在Spotify播放量达7,423,536次,按平台每千次播放收益约4美元计算,该歌曲收入约2.96万美元(约21万人民币) [7] 署名艺人Breaking Rust热度最高的3首AI歌曲总播放量超1800万次,潜在收入超7.2万美元(约51万人民币) [7] - AI歌手获得唱片公司青睐:由Suno打造的AI歌手Xania Monet因登上Billboard榜单,其创作者在300万美元竞价中获得知名音乐厂牌Hallwood Media的合约 [9] 格莱美得主Timbaland等人亦成立AI音乐公司Stage Zero并推出AI艺人TaTa Taktumi [9] - 国内C端商业化路径受阻:国内主流流媒体平台虽允许上架AI音乐,但普遍不向AI创作者提供收益分成,例如酷狗音乐明确表示“AI作品无法签约,故无法产生收益” [11] 创作者试图通过重新混音、替换音轨规避AI标识,但平台审核识别准确率高达99% [13] - 国内AI音乐人影响力显现:尽管无法直接变现,AI音乐人如“大头针”凭借翻唱作品在酷狗音乐TOP500榜登顶,并在短视频平台两个月吸粉近80万,显示出强大的市场关注度 [13][16] - B端市场效率与成本优势显著:对于音乐制作人,使用AI工具可将单曲制作成本从几千至几十万元人民币大幅降低至每月几十、几百元人民币,并免去录音棚需求 [20] 对于企业用户,在广告音乐、短视频配乐等场景使用AI工具可显著提升效率、降低成本,有工作室用户可实现“上午接brief,下午交demo,晚上交成品” [20] - 平台从用户端收费:QQ音乐、酷狗音乐的“AI写歌”功能最低收费为10元人民币生成2首歌曲,即每首成本5元人民币 [18] Suno专业版包年会员每月8美元可生成最多500首歌,相当于每首歌成本仅0.016美元(约0.11元人民币) [18] 版权问题与平台态度 - 版权问题是发展核心制约:与其他生成式AI类似,AI音乐发展受版权问题限制,这直接影响了短视频平台、商业用户及流媒体平台对AI音乐的不同态度 [20] - 短视频平台最为欢迎:因每日海量BGM需求,用户使用AI生成歌曲制作短视频可为平台节省大量版权采购费用,因此平台不仅不限制,甚至会对此类内容进行推流 [21] - 商业场景有规避方法:使用AI辅助创作的音乐作品可通过重新编曲或优化后,向中国音乐著作权协会申请获得版权 [22] 部分AI平台如“谱乐AI”也会为用户生成的歌曲提供原创性证明和授权书 [24] - 流媒体平台态度矛盾:平台要求标注AI音乐,主要因担心侵权带来的连带责任风险,表现出“不反对但拧巴”的态度 [24] 行业出现积极信号,2024年11月Suno、Udio等AI音乐平台先后与华纳音乐、环球音乐集团就版权纠纷达成和解,Suno计划于2026年推出有明确版权的新授权模型,有望从根源解决版权问题 [24] 当前挑战与未来展望 - 市场供需严重失衡:AI工具带来产能爆发,仅Suno平台一天产生的歌曲就达700万首,相当于过去音乐平台一年的产量,但市场并未完全消化,愿意为AI音乐长期付费的受众群体尚未沉淀 [25][26] - 技术层面存在不足:顶尖模型训练数据多基于拉丁语系,生成中文歌曲时常出现咬字错误 [28] 同时存在“AI黑盒”问题,歌曲生成过程不透明,生成后调整空间小,普通用户只能依赖重复“抽卡”式尝试 [28] 当前AI音乐平台仍只是数字音频工作站的雏形,离成熟完整形态尚有距离 [28] - 从业者保持乐观预期:尽管存在挑战,从业者认为AI降低了创作门槛,增加了音乐多样性(如模拟特殊音色),并相信在“供给无限”的未来,能引起人类情感共鸣的高质量创作将更为珍贵 [29] 技术发展规律表明,AI音乐只会继续向前,不会倒退 [29]
Suno ARR 2 亿美金估值 24.5 亿,一个 AI 黑客 Wrapper 种子轮拿了 7000 多万美金
投资实习所· 2025-11-20 14:04
融资与估值 - 公司完成2.5亿美元C轮融资,由Menlo Ventures领投,其他投资人包括Hallwood Media、Lightspeed、Matrix以及NVentures [1] - 公司当前估值达24.5亿美元,较去年5亿美元的估值增长近5倍 [1] 财务表现 - 公司年化收入达到2亿美元,主要来源于订阅收入,相比去年10月披露的1.5亿美元ARR有显著增长 [1] 用户增长与参与度 - 过去两年内,已有近1亿用户在平台上创作音乐,其中许多人是首次进行音乐创作 [1] - 平台用户从听众角色转换为创作者的路径非常简便,社区分享是重要的用户发现渠道 [4] - 顶级制作人和词曲作者已将产品融入日常工作流程,平台上的艺人已获得业内重要排行榜的认可 [1] 产品与市场定位 - 公司致力于构建一个所有人共同参与的生态系统,涵盖创作者、听众以及更广泛的音乐社区 [2] - 产品被类比为音乐创作领域的Instagram或TikTok,是历史上增长最快的C端消费产品之一 [4] - 公司推出面向专业群体的Suno Studio,这是一款专业级数字音频工作站,旨在通过易用界面和AI功能拓展DAW市场 [7] 客户群体分析 - 付费用户主要包括个体创作者和音乐爱好者、专业内容创作者以及企业或商业客户 [5] - 产品的巨大成本效益推动了用户的付费意愿,特别是那些需要通过传统方式制作音乐的个人或中小企业 [4]
Suno Defies Lawsuits, Nabs $250M at $2.45B Valuation for AI Music
Ventureburn· 2025-11-20 06:39
融资与估值 - 公司完成2.5亿美元C轮融资,由Menlo Ventures领投,NVentures、Hallwood Media、Lightspeed和Matrix等机构参与[1] - 此轮融资后公司估值达到24.5亿美元,较今年5月的5亿美元估值大幅增长[2] - Nvidia的风险投资部门NVentures参与本轮融资,显示出对生成式音频领域的强烈信心[9] 业务与产品发展 - 公司推出Suno Studio,将其定位为首个生成式音频工作站,融合多轨编辑与AI音轨创建功能,旨在为用户提供更多控制权、更清晰的混音和更高质量的人声[4] - 公司发布v5模型,是其最先进的模型,声称能提供更清晰的提示和更精确的结果[4] - 公司在推出Studio之前收购了首个基于浏览器的数字音频工作站WavTool,并将其技术整合至自身生态系统中,以构建更深层次的工作流程[5] - 新融资将用于推出更多专业工具,提升普通创作者的体验,扩展社交功能并支持更直观的协作[10] 用户与市场影响 - 公司声称拥有数百万用户,日活跃度很高,并认为这反映了人们在歌曲创作方式上发生了明显的文化转变[3] - 平台创作者涵盖从首次使用者到专业人士,用户使用场景包括尝试想法、制作完整曲目、与朋友分享歌曲以及作为艺术家发布作品[6] - 公司表示已有近1亿人使用其工具,视此为重要文化时刻的证据,并相信AI将改变人们对创造力的定义[11] 法律环境与行业前景 - 公司面临索尼、环球音乐集团和华纳音乐集团的诉讼,这些集团指控公司在未经同意的情况下抓取受版权保护的音乐进行训练,但公司对此予以否认[6] - 公司同时在丹麦面临Koda、在德国面临GEMA的挑战,表明围绕AI训练的法律问题尚未解决[7] - 风险投资机构认为公司反映了深刻的市场变化,相信数百万新创作者将进入音乐领域,AI将在此过程中扮演重要角色,并看好其全栈系统带来的先发优势[8] - 投资者将当前法律挑战视为短期阻力,并认为达成授权协议可能是最终结果,类似于流媒体早期的发展路径[7]
Datavault AI, Music Dash and NFHITS Partner to Transform Music Data Tracking Display and Monetization Through Patented Inaudible Tones®, AI and Blockchain Technology
Globenewswire· 2025-11-04 04:39
合作公告 - Datavault AI Inc (Nasdaq: DVLT) 宣布与NFHITS合作,共同开发专有的Web 3.0、铸造及基于区块链的音乐和内容分发网络 [1] 合作目标 - 两家公司旨在利用Datavault AI的体验、铸造和交换能力,建立公平、透明和自动化的货币化体系 [4] - 合作旨在为艺术家、推广商和活动行业创造年度经常性收入 [6] 技术整合与解决方案 - Datavault AI将其VerifyU和ADIO技术整合到NFHITS的分发框架中,以认证艺术家和音乐版权,保护版税,减少数字盗版,并确保分发完整性 [4] - 该技术基础设施结合区块链和人工智能,重新构想当前的流媒体和分发模式 [5] - 计划利用Datavault AI的ADIO音调技术,将NFHITS的数字音乐投送到购物市场、餐厅、商店等场所,通过听不见的声音向听众设备发送包含独家内容、商品或折扣价等特殊优惠的信息 [5] 合作伙伴背景 - NFHITS及其货币化合作伙伴Music Dash的使命是引领音乐和电影行业进入一个创造力、技术和机遇相结合的新时代 [2] - NFHITS和Music Dash现有的分发网络包括Apple Music、iTunes、Spotify、TikTok、Facebook、Instagram等超过20个平台 [3] - Datavault AI是一家专注于AI驱动数据体验、估值和货币化的公司,其云平台服务于体育娱乐、生物技术、金融科技、房地产、医疗保健等多个行业 [7][9]
1秒上手、30秒成曲,LiberLive首创高动态采样合成系统Liber AOS|最前线
36氪· 2025-10-28 17:07
核心技术:LiberAOS系统 - 公司发布第二代旗舰产品C2无弦吉他,核心技术为全球首个专为无弦吉他设计的高动态采样合成系统LiberAOS [1] - LiberAOS系统整合信号捕捉、处理核心、音频引擎与声学输出四大模块,构建完整的音乐智能工作流 [1] - 系统在交互层面实现精准实时响应,在音质层面依托专业音色库与动态处理技术确保声音表现达到专业水准 [1] 硬件与信号处理 - 系统核心为多核异构芯片组,作为数据处理中枢,通过自研无人机磁感拨片与高精度力控指板组成感应矩阵 [4] - 感应矩阵能精准捕捉指尖按压力度变化、拾指倾斜角度等细微动作,实时提取力度、角度、频率在内的多维信号 [4] - 四核并行架构提供稳定算力保障,自研音频引擎可在毫秒级时间内分析演奏意图并从千万级动态音色库中调用采样资源 [4] 音源库构建 - 为确认真实乐器质感,团队联合多家专业声学实验室对马丁、泰勒等知名品牌经典吉他型号进行系统化采样 [6] - 单把吉他采样周期长达一个月,涵盖不同拨片材质、触弦角度、演奏力度乃至指甲与指肉的触感差异等多维参数 [6] - 构建了独有的海量动态音源库,每个音符背后是一套按演奏力度、技法和情绪特征精细分类的多版本音色集合 [7] 产品性能与应用 - C2搭载由蚕丝钛膜高音单元和3.25英寸低音增强单元组成的双频扬声器系统,实现层次分明、动态饱满的声音表现 [10] - 即使不外接音响,系统也能使乐器演奏呈现具有空间感和临场度的音质,满足小型现场演奏需求 [10] - 产品提供智能弹唱、旋律跟唱等创新功能,支持多场景音乐模式切换,帮助用户快速实现30秒成曲的创作体验 [10]
AI 音乐都发展成这样了?藏师教你一键生成爆款 AI 音乐
歸藏的AI工具箱· 2025-10-16 21:19
AI音乐生成技术演进 - Suno V5模型在音乐生成质量上实现显著突破,音频清晰度极高,用户难以分辨AI生成内容与真人演唱的区别[1] - 该模型支持多维度的音乐元素控制,包括风格提示词、自定义歌词、分段落提示词以及音频上传修改功能,超越了早期版本仅能处理简单提示词的限制[5] - 新增Studio专业模式提供分音轨生成和控制能力,类似专业音频软件的操作逻辑[5] 市场应用与传播热度 - AI生成音乐内容在短视频平台呈现爆发式传播,单个作品获得数十万点赞成为普遍现象[3] - 技术应用范围扩展至热门娱乐形式,例如近期流行的《技能五子棋》也采用AI技术生成背景音乐[3] - 模型支持对经典歌曲进行多风格重混音,例如使用陶喆风格演绎《搁浅》或贾斯丁·比伯风格演绎《兰亭序》[6] 技术操作流程设计 - 工作流分为垫音生成(基于原曲调重新混音)和纯提示词生成(完全创新曲调)两种核心模式[6] - 操作界面包含歌词标注系统(方括号内提示词控制演唱风格)、全局风格设置、人声性别选择等专业参数[7] - 关键参数包括怪异值(控制音乐偏离主流程度)和风格遵循度(控制模型自由发挥空间)[8] 提示词工程体系 - 开发出结构化提示词生成模板,通过大型语言模型自动生成符合Suno要求的专业提示词[9] - 全局风格提示词需包含四大要素:核心曲风、标志性乐器编配、音色与演唱技巧、制作与节奏特点[10][11] - 分段指令系统要求智能划分歌词结构(主歌、副歌、桥段等),并为每个段落设计符合歌曲发展逻辑的编曲指令[12] 版权规避与商业化应用 - 针对版权限制提供两种解决方案:用户自主翻唱录制或使用翻唱音频规避版权检测[20] - Audio Influence参数允许控制生成声音与原始音频的相似度,低设置值可避免音色复刻风险[20] - 技术特性使Suno具备替代传统调音师的潜力,特别适用于内容创作者进行音乐后期处理[20] 行业影响评估 - AI音乐技术从纯生成逻辑转向编辑创作逻辑,大幅提升自由度和准确性[21] - 该技术可能打破音乐行业现有格局,使经典音乐作品能够被低成本、高质量地重新混音创作[21] - 与传统音乐平台低质量Remix内容相比,AI生成音乐在艺术质量上具备明显优势[23]
科技与青春的跨时空交响——水木年华“时空诗旅”数字人演唱会圆满落幕
央视网· 2025-07-21 13:28
技术突破 - 运用高精度AI动作捕捉技术实时记录舞台表演特征,将四位音乐人的艺术灵魂凝铸为永不褪色的数字化身 [4] - 数字化身完整保留声线特质与演唱风格,并能自主学习新的互动模式,包括微表情肌肉颤动和即兴表演 [4] - MarsX独创"时空折叠"引擎打破物理界限,搭建360°赛博岛屿舞台,观众可在火山熔岩、深海极光等超现实场景中自由切换 [6] - 观众通过手势操控虚拟界面与舞台互动,调整视角全景并收集"水木年华"气泡解锁隐藏特效 [6] 用户体验 - 系统支持实时聊天、手势互动等功能,实现自由社交和情感联结 [6] - 15首时代金曲构筑青春记忆图腾,彩虹气球、纸飞机等元素唤起观众情感共鸣 [9] - 演唱会持续1小时,以《一生有你》作为终曲,数万观众数字分身见证星光升入元宇宙天际 [13] 行业影响 - 演唱会标志音乐产业从物理空间向数字生态的范式跃迁,从"线下替代方案"向"独立数字文化产品"质变 [11] - 响应国家文化数字化战略,实践"虚实共生"理念,成为科技赋能文化的示范案例 [11] - 通过经典IP数字重生完成70后至00后的代际情感联结,探索"科技+文化"产业融合新路径 [13] - 验证元宇宙娱乐商业可行性,揭示科技人文主义光辉,拓展情感联结的栖息地 [15]
北京科博会现场东城展示“科创金三角”,互动项目人气爆棚
新京报· 2025-05-08 22:29
参展企业与产品 - 东城区以"科创金三角"为主线邀请35家企业组团参展互动体验项目达16项[1] - 东城展区首发21款新产品新技术其中"科技+文化"板块5项"科技+医疗健康"板块4项"科技+未来产业"板块12项[1] - 保利文化展示时间典藏多功能文保全息展柜——遂公盨已获外观设计专利和发明专利实现360度文物数字模型与实体同步展示[1] - 国博数据推出"衣见如故"古代服饰AI换装体验吸引观众参与[1] - 昆仑万维推出国内首款公开可用的AI音乐生成大模型天工SkyMusic实现乐器人声旋律一体化生成[2] - 万光视效展示《哪吒》幕后制作花絮增强声电体验[2] - 虫洞创想推出《看我天地中轴》VR眼镜提供故宫钟鼓楼等景点沉浸式游览[2] - 乐动天下展示智能划船机系统吸引年轻观众[2] 科技+医疗健康板块 - 北京协和医院展示原创自动化牙髓治疗仪和衰弱及肌少症数字化评估干预系统[2] - 迈胜医疗研发小型化质子放疗设备实现精准抗癌全球突破[2] - 北京市隆福医院联合科技企业推出"数智中医亚健康AI规划师智能体"[2] - 中国中医科学院医学实验中心展示"三部九候康养机器人"[2] - 北京同仁医院鹰瞳科技和缓医疗等机构展示慢性病筛查眼科及医疗服务领域前沿成果[2] 科技+未来产业板块 - 环形展区围绕人工智能+总部数智化北斗时空+智慧城市6G+新一代通信技术新能源与绿色低碳转型四大领域展示头部企业成果[3] - 千寻位置展示千巡翼X1无人机蘑菇车联展示自动驾驶中算电力展示算力智能调度训练平台中国电信展示数字人产品[3] 东城区科创布局 - 东城区聚焦芯片设计健康医疗央企数智化三大细分领域依托安定门外东直门外永定门外10.8平方公里构建"三轴三核多点"布局[3] - 金隅环球贸易中心聚集英特尔高通赛默飞等外资企业英特尔科技体验中心正式运行[3] - 农银理财中投公司等头部金融机构汇聚该区域预计未来两年"科创金三角"资源聚集将显著提升[3]