Workflow
AI生成的歌
icon
搜索文档
他用AI办了个音乐节,主题:别读博
量子位· 2026-05-01 12:18
AI生成音乐内容创作与用户社区 - 一位网名为“馄饨皮茄总”的科研工作者,利用AI音乐生成模型创作了一系列以博士生科研生活为主题的音乐作品,形成了“不读博音乐节”系列,该系列在B站上获得了超5000万次播放和376.4万次点赞[5] - 创作者通过逐条读取粉丝留言和私信,统计整理了上千条点歌需求数据,并据此进行歌曲的呼声权重排序,以指导创作选题[42] - 创作者在制作单曲时,会动用包括Suno、MiniMax Music等商业闭源模型和HeartMuLa、ACE-Step等开源模型在内的多个AI模型进行“赛马”式反复生成,抽卡次数多时同一首歌会生成100多个版本进行筛选和拼接[64][66] 内容创作方法论与质量控制 - 创作过程分为选歌、填词、AI生成音乐三个主要步骤,其中AI生成音乐环节占总工程量至少一半,有时甚至达到70%[62] - 在填词阶段,创作者会严格记录原曲歌词的字数、断句、重音位置及停顿,并确保改编歌词的句尾韵脚发音与原词对齐,以使歌手口型能够自然对上[53][54] - 创作者对最终作品的核心要求是“好听耐听”,并追求在情感表达效果上让听众暂时忘记这是一首抽象的二创,其作品具有很高的“我”的含量和主体性[72][74][75] 目标用户群体与市场需求 - 内容的核心受众是研究生和博士生群体,他们通过音乐寻找共鸣和归属感,以排解科研中的迷茫、困惑、疲惫等情绪[35][85][86] - 根据国家统计局数据,全国在学研究生人数(含硕士和博士)持续增长,从2023年的388.3万增至2024年的409.5万,预计2025年将达到430万,这意味着目标用户群体是一个持续扩张的市场[105] - 创作者收到了超过3000封粉丝来信,许多用户表示会在做实验时循环播放这些歌曲,或在读博压力大时反复收听,甚至有人计划将其写入论文致谢,显示了内容与用户之间建立了强烈的情感连接[79][81] AI技术在创意产业中的应用与局限 - AI音乐生成模型目前存在局限性,例如难以处理密集复杂的和声叠唱,在多声道音频中可能失去层次感;同时,模型充满“幻觉”,无法做到100%稳定,可能出现突然的升调降调、咬字不清或改变旋律等问题[63][77] - 创作者在利用AI生成音乐后,会进行大量的人工后期调整,包括修改配乐、调整咬字发音(如将发音不准的中文字改为英文同音词或笔画更少的中文字)以及修改调性,有时甚至会付费找真人歌手录制Demo以提升质感[68][70] - 尽管AI在旋律生成方面提供了强大工具,但填词工作被认为需要人脑主动思考和温度,AI基本帮不上忙,创作者也拒绝使用AI生成歌手演唱画面或对口型,坚持使用现场Live视频素材以保证情绪沉浸感和画质[49][61]