AI多人有声剧自动化方案
搜索文档
豆包语音团队发布“AI多人有声剧”自动化方案
上海证券报· 2025-10-28 19:34
技术方案核心 - 发布“AI多人有声剧”全自动化生产方案,支持从小说文本到高质量多人有声剧成品的端到端AI制作 [1] - 方案基于高自然度的多角色智能朗读,并实现全自动AI后期链路,包括自动添加音乐、音效、特效及智能混音 [1] - 方案可自动进行角色划分,准确率超过98% [1] 技术能力与效果 - 语音大模型通过海量文本与语音的多模态预训练,融合文本和语音模态,引入思维链信息,具备强大的文本理解和语音演绎能力 [1] - 画本预测模型实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,并进行音频召回合成与智能动态参数调整 [2] - 多人演播效果发音自然、情感丰富,能够生产媲美真人水准的有声剧作品 [1] 行业影响与优势 - 该方案使听书自然度和沉浸感显著提升,且生产链路全程无人工参与 [1] - 方案可大幅降低有声剧制作成本、缩短制作周期,高效覆盖更多书籍 [1] - 首批端到端创作的作品已在番茄小说App上线,效果超出预期并获得用户良好反馈 [2] 未来发展计划 - 未来方案将不断升级,覆盖更多有声内容 [2] - 目标实现小说更新后即可让用户同步享受精品有声剧 [2]
豆包语音团队提出“AI多人有声剧”方案
新浪科技· 2025-10-28 16:23
产品发布 - 豆包语音团队发布"AI多人有声剧"自动化方案 [1] - 方案支持多角色、高表现力的TTS(语音合成)演播 [1] - 方案实现了全自动AI后期链路 [1] 技术流程 - 从小说文本到高质量的多人有声剧成品全部由AI端到端完成 [1] - 首批通过该方案端到端创作的作品已在番茄小说APP上线 [1]
小说一键转有声剧!豆包语音团队提出「AI多人有声剧」方案,沉浸感拉满了
机器之心· 2025-10-27 18:40
AI多人有声剧技术方案 - 豆包语音团队发布端到端AI多人有声剧自动化方案,从小说文本到高质量多人有声剧成品全部由AI自动完成[3] - 方案基于多角色Seed-TTS-2模型,配合AI自动音乐、音效、特效和智能混音,听感效果媲美行业一流水准的真人有声剧[3] - 该方案大幅降低有声书生产制作成本和周期,首批有声剧已在番茄小说App上线[3] 技术实现细节 - 方案支持从小说文本到多角色智能朗读音频的全自动生产,音色匹配和对话归属准确率超过98%[8] - 多角色Seed-TTS-2模型通过篇章级长上下文感知、历史长音频建模和多轮思维链推理三大创新点提升演绎效果[8] - 全自动AI后期实现画本预测,包含人声特效预测(准确度接近100%)、动作音效预测、环境识别预测和智能配乐系统[10][12] 传统与AI制作模式对比 - 传统多人有声剧制作周期长达数月,需经过人工切分画本、声优录制和后期精修等多道工序[5] - AI方案实现端到端自动化生产,通过智能混音技术平衡音轨,确保对白清晰突出且听感自然统一[5][12]