豆包语音团队发布“AI多人有声剧”自动化方案
上海证券报·2025-10-28 19:34

技术方案核心 - 发布“AI多人有声剧”全自动化生产方案,支持从小说文本到高质量多人有声剧成品的端到端AI制作 [1] - 方案基于高自然度的多角色智能朗读,并实现全自动AI后期链路,包括自动添加音乐、音效、特效及智能混音 [1] - 方案可自动进行角色划分,准确率超过98% [1] 技术能力与效果 - 语音大模型通过海量文本与语音的多模态预训练,融合文本和语音模态,引入思维链信息,具备强大的文本理解和语音演绎能力 [1] - 画本预测模型实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,并进行音频召回合成与智能动态参数调整 [2] - 多人演播效果发音自然、情感丰富,能够生产媲美真人水准的有声剧作品 [1] 行业影响与优势 - 该方案使听书自然度和沉浸感显著提升,且生产链路全程无人工参与 [1] - 方案可大幅降低有声剧制作成本、缩短制作周期,高效覆盖更多书籍 [1] - 首批端到端创作的作品已在番茄小说App上线,效果超出预期并获得用户良好反馈 [2] 未来发展计划 - 未来方案将不断升级,覆盖更多有声内容 [2] - 目标实现小说更新后即可让用户同步享受精品有声剧 [2]