AI音乐
搜索文档
腾讯研究院AI速递 20251027
腾讯研究院· 2025-10-27 00:41
OpenAI产品与战略更新 - ChatGPT企业版新增"公司知识"功能,可连接Slack、Google Drive、GitHub、SharePoint等内部工具进行多源检索并综合答案,该功能仅向Business、Enterprise、Edu版开放,使用特调的GPT-5模型 [1] - OpenAI与茱莉亚学院合作标注海量乐谱用于音乐模型训练,积极布局AI音乐To B市场,特别是广告行业,Suno凭借订阅模式今年年度经常性收入(ARR)达1.5亿美元且毛利率超60% [2] - OpenAI收购曾为Mac开发自然语言交互界面Sky的公司SAI,将整合其技术并吸纳约12人团队,此举被视为公司为ChatGPT入局操作系统铺路 [7] 中国科技公司AI产品动态 - 腾讯正式发布ima 2.0,推出"任务模式"成为业界首个融合Agent能力的个人知识库,可理解复杂任务并自主拆解步骤,该产品已服务20多个行业,累计沉淀2亿份知识库文件 [3] - 阿里首款自研AI眼镜夸克AI眼镜正式开售,88VIP会员最低到手价3329元,搭载高通AR1芯片与恒玄BES2800协处理器,整合通义千问、夸克AI、高德导航等阿里生态 [4] AI行业监管与伦理 - 日本知识产权战略国务大臣公开呼吁OpenAI在推出Sora 2时应避免侵犯版权,强调漫画与动画角色是日本"文化瑰宝",日本已出台《生成AI推进法》为政府干预AI乱象提供政策依据 [5][6] - 深度学习"三巨头"之一的Yoshua Bengio成为全球首个引用量超过100万的科学家,其代表作GAN论文获超10万引用,现从纯粹科学家转变为积极的AI伦理倡导者 [8] AI技术前沿与应用 - Nature刊登由Neuralink联合创始人Max Hodak创办的Science Corporation主导的PRIMA人工视觉技术研究,帮助70岁AMD患者重获光明,84%患者恢复功能性中央视力 [9] - 大西洋月刊报道ChatGPT采用"聊天诱饵"策略,通过持续提问延长对话,Meta正训练AI机器人主动发消息提高留存率,OpenAI推出ChatGPT Pulse打破被动回答模式 [10][11] AI对开发者的影响 - AWS首席布道师Jeff Barr认为AI Agent接管"实现"后,开发者核心价值从"与机器沟通"转向"与人沟通",未来工作将从"主要靠手写代码"转向"主要靠大脑阅读和审查代码" [12]
OpenAI放大招:进军音乐模型
财联社· 2025-10-25 22:40
OpenAI音乐模型开发现状 - OpenAI正积极开发AI音乐模型,工程师与茱莉亚音乐学院学生合作进行乐谱标注以获取训练数据[2] - 模型探讨利用文本和音频提示词生成音乐,例如为现有声乐曲目添加吉他伴奏,旨在降低短视频配乐等内容创作门槛[2] - 音乐模型具备商业化潜力,广告公司可用其创作广告歌词和旋律,助力公司向广告领域拓展[4] - OpenAI在音乐领域早有布局,2019年推出音乐生成模型MuseNet,2020年发布会唱歌的Jukebox模型[4] - 但MuseNet和Jukebox均未被整合进ChatGPT和Sora,因技术及计算成本限制,其生成音乐与人类创作仍有差距[6] - 公司拥有超过8亿活跃用户,音乐模型将帮助构建更全面的AI生态系统,进一步提升用户黏性[3] 全球AI音乐行业竞争格局 - 随着算力和模型架构进步,音乐生成技术迎来实用化可能,成为继文本与视频后的新一轮AI技术竞赛焦点[7] - 谷歌于今年5月推出第二代音乐制作模型Lyria,特别强调可为广告制作配乐,与OpenAI商业化方向高度重合[7] - 初创公司Suno和Udio的AI音乐生成产品已成功商业化,Suno成立仅三年,年经常性收入达1.5亿美元,比一年前增长近四倍[7] 中国AI音乐模型发展 - 中国AI音乐模型迅速崛起,去年字节跳动豆包大模型团队推出具备灵活控制能力的音乐生成模型家族Seed-Music[9] - 今年初阿里通义实验室开源音乐生成模型InspireMusic,旨在打造集音乐生成、歌曲生成、音频生成能力为一体的开源AIGC工具包[9] - 3月26日昆仑万维发布全球首款音乐推理大模型Mureka O1,多项性能超越Suno V4、登顶SOTA[10] - 6月16日腾讯AI Lab开源SongGeneration音乐生成大模型,专注解决音乐AIGC中音质、音乐性与生成速度三大共性难题[11] - 9月12日MiniMax上线音乐生成模型Music1.5,实现强控制力、人声自然饱满、编曲层次丰富、歌曲结构清晰四大新突破[12]
杭州又将迎来一场国际盛会
每日商报· 2025-10-23 06:18
博览会概况 - 2025杭州国际音乐演艺产业博览会将于2025年11月14日至16日在钱江世纪城举办 [1] - 博览会主题为“音乐无界 智启未来”,旨在打造世界级产业交流与趋势引领盛会 [1] - 重要板块包括中国新音乐排行榜颁奖盛典和向市民免费开放的MUSIC PIE音乐与艺术展 [1] 参与企业与展示内容 - 腾讯音乐娱乐集团、网易云音乐、抖音、快手、国际唱片业协会等40余家全球头部音乐及科技企业将参展 [1] - 参展企业将展示核心产业资讯、前沿AI音乐科技、丰富内容生态与沉浸式互动体验 [1] - 参与者可近距离体验音乐科技、参与明星巡展互动并领取限量免费周边 [2] 同期活动与行业趋势 - 莱福岛生活节5.0定档11月16日,以“四季回响”为主题,延续“音乐节+”的多元理念 [2] - 行业聚焦于AI创作、智能音频、虚拟艺人、数字版权、音乐硬件创新等前沿科技领域 [1] - 活动深度探索音乐与演艺的融合创新,汇聚全球顶尖音乐与演艺力量 [1]
AI音乐的“野蛮”时代,要结束了
36氪· 2025-10-21 20:34
AI音乐行业融资与估值 - AI音乐创业公司Suno正在谈判筹集超过1亿美元资金,估值将超过20亿美元,较之前翻了两番 [1] - Suno目前每年产生的经常性收入超过1亿美元 [1] - AI语音巨头ElevenLabs获得英伟达的战略投资 [1] 主要公司技术进展 - Suno发布史上最强大模型V5,带来音质飞跃并提供前所未有的创作控制 [6] - Suno推出首个数字音频工作站Suno Studio,包含生成与现有音频轨道相匹配音乐元素的功能 [6] - Udio推出新型可视化编辑工作站Sessions,允许移动、扩展或替换歌曲不同部分 [4] - ElevenLabs推出极简路线的AI音乐产品Eleven Music,主界面只有一个输入框,操作完全对话式 [10] - 国内趣丸科技推出国内首个对话式音乐创作Agent"Tunee"并开启全球公测 [8] 技术范式变革 - Suno Studio颠覆传统数字音频工作站逻辑,用户仅需"框选-输入-播放",AI自动根据调性、BPM、情绪补全乐段 [8] - 新技术让用户哼唱旋律即可变成真正乐器演奏,将技术门槛降为零 [8] - AI音乐从一次性生成转变为可循环修改与重组的过程 [6] - Suno和Udio的更新让AI音乐真正融入工作流,把创作核心拉回到创意决策和审美把控 [8] 版权诉讼升级 - Anthropic与作家群体达成15亿美元版权诉讼和解协议,刷新AI领域版权纠纷纪录 [15] - 三大唱片及独立音乐人升级对Suno与Udio的侵权诉讼 [3] - 诉讼指控Suno蓄意规避YouTube技术保护措施,非法下载并复制受版权保护音乐作品用于模型训练 [17] - Suno早期投资人言论几乎直接证实公司在版权问题上的有意规避 [19] - Udio被指控蓄意破解技术保护措施,平台生成音乐存在与经典歌曲高度相似的旋律片段 [19] 行业合作与监管 - Spotify宣布与三大唱片、Merlin、Believe合作开发负责任且艺术家优先的AI音乐产品 [1] - Eleven Music已与独立音乐组织Merlin和版权商Kobalt达成授权协议 [12] - 环球音乐和华纳音乐与包括Suno在内的AI音乐公司达成了许可协议 [23] - Spotify过去一年删除超过7500万首"垃圾曲目" [23] - Spotify推出三项新政策强化对AI内容的监管,包括要求提供AI使用披露信息 [25] 行业生态重构 - AI正在重新分配音乐领域的权力,重塑从内容创作到艺人经纪的每个环节 [28] - 音乐生产方式与底层逻辑被彻底改写,职业经理人需要为艺人守护新型权利如声音肖像权、AI训练使用权等 [28] - 集体管理组织面临变革压力,需要积极维权、精简运营、拓展业务边界 [30] - 技术改变艺术生产方式,音乐不再是少数人的游戏,权力天平向善于拥抱技术的玩家倾斜 [30]
AI 音乐都发展成这样了?藏师教你一键生成爆款 AI 音乐
歸藏的AI工具箱· 2025-10-16 21:19
AI音乐生成技术演进 - Suno V5模型在音乐生成质量上实现显著突破,音频清晰度极高,用户难以分辨AI生成内容与真人演唱的区别[1] - 该模型支持多维度的音乐元素控制,包括风格提示词、自定义歌词、分段落提示词以及音频上传修改功能,超越了早期版本仅能处理简单提示词的限制[5] - 新增Studio专业模式提供分音轨生成和控制能力,类似专业音频软件的操作逻辑[5] 市场应用与传播热度 - AI生成音乐内容在短视频平台呈现爆发式传播,单个作品获得数十万点赞成为普遍现象[3] - 技术应用范围扩展至热门娱乐形式,例如近期流行的《技能五子棋》也采用AI技术生成背景音乐[3] - 模型支持对经典歌曲进行多风格重混音,例如使用陶喆风格演绎《搁浅》或贾斯丁·比伯风格演绎《兰亭序》[6] 技术操作流程设计 - 工作流分为垫音生成(基于原曲调重新混音)和纯提示词生成(完全创新曲调)两种核心模式[6] - 操作界面包含歌词标注系统(方括号内提示词控制演唱风格)、全局风格设置、人声性别选择等专业参数[7] - 关键参数包括怪异值(控制音乐偏离主流程度)和风格遵循度(控制模型自由发挥空间)[8] 提示词工程体系 - 开发出结构化提示词生成模板,通过大型语言模型自动生成符合Suno要求的专业提示词[9] - 全局风格提示词需包含四大要素:核心曲风、标志性乐器编配、音色与演唱技巧、制作与节奏特点[10][11] - 分段指令系统要求智能划分歌词结构(主歌、副歌、桥段等),并为每个段落设计符合歌曲发展逻辑的编曲指令[12] 版权规避与商业化应用 - 针对版权限制提供两种解决方案:用户自主翻唱录制或使用翻唱音频规避版权检测[20] - Audio Influence参数允许控制生成声音与原始音频的相似度,低设置值可避免音色复刻风险[20] - 技术特性使Suno具备替代传统调音师的潜力,特别适用于内容创作者进行音乐后期处理[20] 行业影响评估 - AI音乐技术从纯生成逻辑转向编辑创作逻辑,大幅提升自由度和准确性[21] - 该技术可能打破音乐行业现有格局,使经典音乐作品能够被低成本、高质量地重新混音创作[21] - 与传统音乐平台低质量Remix内容相比,AI生成音乐在艺术质量上具备明显优势[23]
一年下架 7500 万首,Spotify 下力气整治“AI垃圾曲目”
36氪· 2025-09-29 20:12
Spotify平台AI音乐清理行动 - 公司过去一年删除了超过7500万条"垃圾曲目",主要包括违规AI生成音乐、未经授权模仿人声的AI歌曲以及被擅自上传至真实音乐人主页的作品 [1] AI音乐在平台留存现状 - 清理行动后平台上仍存在大量AI音乐内容,包括月听众数量在30万到60万不等的知名AI音乐人(如The Velvet Sundown、Aventhis、The Devil Inside)以及9月份发布的新作品 [2] - 平台仍存在大量使用AI生成头像、快速发专辑的AI音乐人账号,表明清理行动并非一刀切 [2] - 部分AI音乐人通过平台流量实现盈利,例如开通粉丝捐赠通道和线上周边商店 [3] Spotify新政策与措施 - 推出"反冒名政策",针对未经许可模仿人声的AI音乐并开通举报通道,但主要依赖原创音乐人及其团队进行举报 [4] - 与发行商合作测试新预防策略,从源头阻止作品被擅自上传至真实艺人主页,并投入更多资源处理内容错配问题以缩短审核时间 [4] - 计划在秋季推出"音乐垃圾过滤器",识别批量上传、重复歌曲、靠SEO刷关键词和故意做短的歌曲等行为 [4] - 与行业组织DDEX合作制定AI音乐署名标准,要求发行商和唱片公司记录歌曲是否使用AI,但具体披露方式尚未确定 [5] 行业动态与背景 - 唱片公司(环球音乐和索尼音乐)与AI公司Suno诉讼无解后,先后宣布与SoundPatrol Inc合作,采用音频视频指纹识别取证AI模型检测AI音乐版权侵权行为 [6] - Suno公司发布新的创作宿主Suno Studio,融合AI音乐生成技术与专业多轨编辑工具,瞄准专业音乐人市场 [6] - Spotify在此时宣布整顿"垃圾曲目",对外界释放了音乐平台的立场 [5][6]
海淀105款大模型背后:看这些AI玩家如何抢占内容生产制高点
量子位· 2025-09-19 14:07
AIGC重塑内容生产 - AIGC应用显著降低创作门槛 使每个用户都能成为内容生产者 全球已有4500万用户使用视频生成大模型[10][11] - 视频生成技术达到世界领先水平 多项测评指标排名第一[9] - 短剧创作时间缩减至传统方式的三分之一以下 大幅降低时间与物质成本[16] 商业化变现与市场规模 - 快手可灵大模型月付费流水超过1亿元 处于全球第一梯队商业化水平[36] - 每日生成10万条AIGC广告 营销素材日均消耗达3000万元[42] - 海外众筹项目CODE27在不到一个月内筹集超200万美元 显示强劲市场潜力[28] 技术突破与行业应用 - 实现创意平权 音乐创作从数万专业人群扩展至数亿普通用户[16] - 构建高质量数据集 采用好莱坞级影视数据提升生成内容美感[40] - 视频生成技术未来将与人形机器人和具身智能产业结合[44] 版权与合规机制 - AI音乐平台将版权完全归属用户 平台协助代发行且不占有版权[54] - 采用区块链技术实现所有权追溯 减少版权纠纷[59] - 训练数据选择所有权清晰内容 与高校合作获得专业音乐数据库支持[59] 全球化发展与文化输出 - 在巴西设立中国-金砖国家人工智能海外成果转化中心[46] - AIGC短剧成为文化输出新载体 中文在线等企业针对北美市场生成本地化内容[47][52] - 华人创业团队在MaaS和RaaS领域展现全球竞争力 多家企业获海外融资[52][53] 产业生态与投资趋势 - 海淀区备案大模型达105款 占全国总量五分之一[3] - AI原点社区聚集超过300家人工智能创业公司 覆盖大模型与算力基础设施[20] - 投资逻辑聚焦团队能力、市场规模及商业化潜力 重点关注垂直行业痛点解决方案[30] 内容质量保障机制 - 通过技术进步提升生成内容清晰度与审美符合度[39] - 增强模型可控性 支持提示词操控视频帧序列[40] - 确保内容符合法律法规要求 促进视频生态健康发展[41] 人机协同新范式 - AI作为执行工具辅助创意实现 人类保持核心创造力主导地位[48][49] - 在XR乐园等场景部署AI讲解员 增强交互体验并降低运营成本[66][68] - 文旅领域创新应用获得显著传播效果 单条视频播放量达4000万次[73]
趣丸科技“AI乐之乡”走进乡村,以AI音乐激活文化传承新动能
金融界· 2025-09-05 16:06
项目背景与范围 - 趣丸科技在乡村振兴背景下发起"AI乐之乡"项目 以AI技术为核心推动文化传承与创新 [1] - 项目覆盖广东省揭阳 清远 潮州 肇庆等地近70个乡村公益站点 服务近千名乡村儿童 [1] - 项目获得中国网络视听协会网络公益工作委员会指导 并联合广东省岭南教育慈善基金会等组织实施 [1] 音乐教育创新模式 - 通过户外音乐课堂引导儿童聆听自然之声 并用肢体动作或即兴哼唱表达情绪 [2] - 采用有奖问答 趣味游戏和陶笛互动等形式降低音乐学习门槛 [2] - 儿童使用站点配置的iPad在10分钟内即可通过AI工具完成音乐创作 [2] 科技与文化融合实践 - 在连南瑶族自治县将AI与国家级非遗"客家山歌"深度融合 儿童借助AI平台创作融合传统与科技的作品 [3] - 广州龙潭村儿童挖掘800年水乡文化 将龙舟竞技 古榕等元素转化为音乐素材 [3] - 潮州沙溪镇儿童通过"图生曲"功能将绘画作品转换为歌曲 实现科技与文化表达的结合 [3] 项目成果与社会影响 - 创作作品将参评"律动羊城・韵传九州"青少年AI音乐征集大赛 与第十五届全国运动会形成联动 [3] - AI工具成为青少年认识世界和表达自我的"数字画笔" 全流程培养创新思维 [4] - 项目为乡村文化振兴与教育均衡发展注入新动能 使音乐创作不再是遥不可及的梦想 [4]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 21:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
音乐极客的平权实验:他想在写歌上再造一个快手
虎嗅· 2025-08-25 11:26
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 实现AI与音频首次结缘[4] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》 此后数十年间AI音乐发展缓慢 马尔可夫链 循环神经网络和卷积神经网络等技术难以突破全链条生成门槛[5] - 2016年谷歌推出Magenta项目 利用深度学习框架展示AI音乐生成能力 成为行业重要里程碑[6] - 2024年Suno横空出世 首次实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界"ChatGPT"[7] 音潮公司核心战略 - 公司致力于实现"音乐平权" 让每个人都能用音乐记录生活 目标重塑音乐行业和IP生态[35] - 产品采用B端开放API接口与C端按首收费相结合商业模式 C端用户可免费创作4首歌 超过部分需付费 儿童音乐教育和AI教育场景完全免费[51] - 通过自建国内最大音乐数据标注库构建数据壁垒 与上海音乐学院建立联合实验室 由数十名学生参与数据标注工作[52] - 移动端产品每三周迭代一次 网页端每两周迭代一次 持续增加新功能激发用户创作热情[38][47] 技术演进与突破 - 2016年深度学习技术突破解决人声与伴奏分离行业难题 采用医疗影像血管分离模型应用于语谱图分析 效果显著提升[6][11] - 2021年Transformer架构大模型出现 2024年实现端到端音乐生成 模型训练数据达到千万首时出现"智力涌现"现象 质量突飞猛进[7][36] - 使用国产芯片进行训练和推理 采用训推一体化方案降低成本 推理请求量大时将训练机器转为推理使用[48] 市场竞争格局 - 国内AI音乐研究人员屈指可数 算法圈人员分布呈现自然语言处理最多 计算机视觉次之 音频相关最少的格局 音乐生成领域专家不足10人[13][14] - Suno专注于专业音乐人生产工具和流媒体平台 Riffusion采用GPT聊天方式创作音乐 Eleven Labs在语音合成领域领先并推出音乐API[41][59][70] - 腾讯AudioGenie专注于视频和图像配音效 多模态能力突出但非完整音乐作品生成[49] 用户获取与留存策略 - 目标用户首先锁定学生群体 因其思维活跃 接受新事物能力强 使用频率和时间充足[45] - 通过"音果"功能实现歌曲要素混合创作 建立"音缘"社交关系 游戏化创作过程增强用户粘性[43] - 提供IP养成和收益分成机制 用户可通过播放量获得收益 版权完全归用户所有[51][53] 资源投入与成本控制 - 训练推理采用国产芯片方案 性价比显著 通过动态资源调配降低运营成本[48] - 团队每月投入200-300美元测试新兴AI产品 包括可灵 即梦 PixVerse等视频生成工具 保持技术敏感度[68][69] - 依托世界人工智能大会宣传获得数十万注册用户 通过高频迭代维持用户活跃度[65]