Workflow
多方言语音合成
icon
搜索文档
清华大学与巨人网络联合首创多方言语音合成框架,数据代码方法全开源
新浪科技· 2025-10-15 14:28
技术突破 - 巨人网络AI Lab与清华大学电子工程系联合首创多方言语音合成大模型框架DiaMoE-TTS [1] - 该框架是首个在一定程度上媲美工业级方言TTS模型的开源全套解决方案 [1] - 研究团队基于语言学家的专业经验构建了统一的IPA表达体系 并在仅依赖开源方言ASR数据的前提下提出方案 [1] 行业影响 - 该框架旨在解决方言TTS领域缺乏统一语料构建方法和可实现多语言的端到端开源框架的难题 [1] - 现有的工业级模型往往依赖巨量专有数据 使方言TTS从业者和研究者几乎无从下手 [1] - 方案在英语 法语 德语 荷兰比尔茨语等多语种场景中已验证 具备全球范围内多语言的可扩展性与稳健性 [1] 开源目标 - 数据代码方法全开源 旨在推动方言语音合成的公平与普惠 [1][2] - 让任何研究者 开发者乃至语言文化保护工作者都能自由使用 改进与扩展这一框架 [2] - 目标是让小众语言与方言的声音通过开源的力量被更广泛地听见与传承 [2]