小说一键转有声剧!豆包语音团队提出「AI多人有声剧」方案,沉浸感拉满了
机器之心·2025-10-27 18:40
AI多人有声剧技术方案 - 豆包语音团队发布端到端AI多人有声剧自动化方案,从小说文本到高质量多人有声剧成品全部由AI自动完成[3] - 方案基于多角色Seed-TTS-2模型,配合AI自动音乐、音效、特效和智能混音,听感效果媲美行业一流水准的真人有声剧[3] - 该方案大幅降低有声书生产制作成本和周期,首批有声剧已在番茄小说App上线[3] 技术实现细节 - 方案支持从小说文本到多角色智能朗读音频的全自动生产,音色匹配和对话归属准确率超过98%[8] - 多角色Seed-TTS-2模型通过篇章级长上下文感知、历史长音频建模和多轮思维链推理三大创新点提升演绎效果[8] - 全自动AI后期实现画本预测,包含人声特效预测(准确度接近100%)、动作音效预测、环境识别预测和智能配乐系统[10][12] 传统与AI制作模式对比 - 传统多人有声剧制作周期长达数月,需经过人工切分画本、声优录制和后期精修等多道工序[5] - AI方案实现端到端自动化生产,通过智能混音技术平衡音轨,确保对白清晰突出且听感自然统一[5][12]