声音复刻 - 财报，业绩电话会，研报，新闻 - Reportify

声音复刻

搜索文档

字节、讯飞、MiniMax，为什么都在上新“声音复刻”？

AI研究所· 2025-07-04 17:28

声音复刻技术竞速 - 字节跳动旗下豆包AI播客功能全量上线，可将8万字英文PDF在数秒内生成男女对谈播客，语气词、停顿节奏与真人无异 [1][2] - 科大讯飞2024年4月推出声音复刻功能升级，仅需10秒音频素材即可复刻角色声音，情绪表达与原角色难分伯仲 [1] - MiniMax海螺AI在2024年底已实现30秒语音素材克隆唐国强、林黛玉等人物声音，情感还原度高 [1][7] 技术细节与优势 - 豆包AI播客能将8万词英文起诉书在1-2分钟内转化为带封面图的完整播客，自动添加语气词、附和与停顿 [4] - 科大讯飞构建"三阶段层次化语音建模框架"，通过星火底座大模型精确捕捉发音规律，实现"超拟人"效果 [4] - 海螺AI对中文语音情绪与音色把控精细，如林黛玉声音克隆中精准捕捉哀怨感，相比海外产品更贴合中文语境 [8] 行业应用与场景 - 讯飞超拟人合成技术已应用于智能座舱、教育等场景，如蔚来汽车智能助手NOMI情感表达与交互自然度大幅提升 [6] - 微软AzureAISpeech推出"神经语音"技术，谷歌WaveNet以波形级生成提升语音真实感 [9] - 中文场景下形成技术梯队：字节在语义理解领先，讯飞在专业场景精度占优，MiniMax以轻量化克隆和情感表达突围 [9] AI播客市场前景 - 2024年中文播客听众将达1.34亿，76.2%用户每天收听超半小时 [11] - 播客变现模式包括广告、付费订阅与IP衍生开发，头部节目单期广告报价达2-15万元，付费节目销售额可达数百万 [12][13] - 2024年中国播客广告市场收入约33亿人民币，规模仍有限但潜力巨大 [14]

Artificial Intelligence

MiniMax海螺AI

Artificial Intelligence

MiniMax海螺AI