方言语音合成
搜索文档
氪星晚报|微信公关总监:朋友圈不会有访客功能,也不太可能出二次编辑功能;百度搜索发布行业首个开放式实时互动数字人智能体;官方通报“蔡国强烟花秀”事件调查核查情况
36氪· 2025-10-15 19:29
政府与企业合作 - 中国工信部部长会见苹果公司CEO,强调中国将坚定不移推进高水平对外开放,大力推进智能产业化和产业智能化,为外资企业营造良好营商环境 [1] - 希望苹果公司继续深耕中国市场,积极参与中国新型工业化进程,与中国产业链上下游企业协同创新发展 [1] 公司战略与产品动态 - 微信公关总监表示朋友圈不会有访客功能,以避免增加社交压力,同时朋友圈也不太可能出二次编辑功能 [2] - 日本乐天据悉正考虑将其信用卡业务在美国进行首次公开募股,相关考虑处于早期阶段,其他选择包括将股份出售给战略买家 [3] - 京东汽车联合宁德时代时代电服和广汽集团推出的新车预计定价在10万至12万元之间,将于京东双十一期间发布并独家销售,可能采取巧克力换电模式 [6] 技术研发与创新 - 清华大学与巨人网络联合首创多方言语音合成大模型框架DiaMoE-TTS,数据代码方法全开源 [3] - 商汤科技与寒武纪达成战略合作,重点推进软硬件联合优化,并围绕国产化AI基础设施构建、垂直业务开拓与科技出海等方向开展合作 [4] - 百度搜索发布行业首个开放式实时互动数字人智能体,并升级文心助手AIGC创作能力,支持8种模态创作,用户日均生成AIGC内容已破千万 [5] 国际合作与投资 - 印度巴蒂电信与谷歌合作在维沙卡帕特南建立印度首个AI枢纽,谷歌计划在2026-2030年间投入约150亿美元建设千兆瓦级数据中心运营体系 [5] - 美国减肥生物科技公司Kailera完成6亿美元B轮融资,由贝恩资本领投,用于推进下一代肥胖症治疗药物研发 [6] - 新果农业Singrow完成数百万美元A轮融资,资金将用于技术研发和市场扩张 [6] 行业政策与基础设施 - 国家发展改革委等部门印发方案,目标到2027年底在全国范围内建成2800万个充电设施,提供超3亿千瓦公共充电容量,满足超8000万辆电动汽车充电需求 [8] - 央行数据显示9月末人民币存款余额324.94万亿元,同比增长8%,前三季度人民币存款增加22.71万亿元,其中住户存款增加12.73万亿元 [7] 市场与贸易 - 菲律宾将于11月起恢复对中国公民的电子签证项目,以旅游或商务目的赴菲且行程不超过14天的中国公民可申请,旨在促进贸易旅游合作 [9]
清华&巨人网络首创MoE多方言TTS框架,数据代码方法全开源
机器之心· 2025-10-15 12:08
技术方案概述 - 巨人网络AI Lab与清华大学电子工程系SATLab联合首创DiaMoe-TTS,这是一个在一定程度上媲美工业级方言TTS模型的开源全套解决方案[2] - 该方案基于语言学家的专业经验构建了统一的国际音标表达体系,并仅依赖开源方言ASR数据[2] - 在推出中文方言版本前,研究团队已在英语、法语、德语、荷兰比尔茨语等多语种场景中进行验证,确保方法具备全球多语言的可扩展性与稳健性[2] 开源贡献与可及性 - DiaMoE-TTS是一个面向学术界与开源社区的全链路贡献,旨在推动方言语音合成的公平与普惠[4] - 代码与训练推理脚本已在GitHub全面开源,并提供全开源的数据预处理流程[6][7] - 框架提供统一的IPA标注与对齐方法、完整的训练与推理代码,以及方言感知MoE架构与低资源适配策略,降低复现与扩展门槛[7] 核心技术创新 - 引入国际音标作为统一输入体系,将所有方言语音映射到同一音素空间,消除跨方言差异性,保证建模一致性与泛化能力[13] - 设计方言感知的Mixture-of-Experts架构,通过动态门控机制自动选择最合适的专家路由,保留每种方言的音色和韵律特点[15] - 针对低资源方言提出参数高效迁移策略,仅需微调少量参数即可完成方言扩展,避免对已有知识的遗忘[19] 模型性能表现 - 在数据量充足的粤语上,DiaMoE-TTS在WER、MOS和UTMOS三个指标上均接近工业界语音大模型表现[25] - 该方案支持的方言范围更广,甚至可以扩展到京剧韵白等特殊类型,并在极少量数据下实现快速建模[25] - 消融实验表明,完整方案在所有方言上都取得最佳效果,WER从90%以上显著下降到30%~40%区间,MOS评分提升1~2分[27][28] 应用前景与未来发展 - 该框架旨在让全球研究者与开发者更便捷地参与方言与小语种语音技术研究,在教育、文化保护、虚拟人、数字文旅与跨境交流等场景中发挥价值[33] - 未来将持续扩展更多方言与小语种语料,完善IPA对齐与数据预处理流程,探索更高效的低资源建模方法[33] - 目标是在开放数据驱动下,实现低成本、低门槛、可扩展的多方言语音合成方案[30]