Workflow
登顶 Arena!MiniMax 最新 Speech-02 模型屠榜:超越OpenAI、ElevenLabs,人声相似度99%
AI前线·2025-05-15 14:45

作者 | 凌敏 没有什么比"群星闪耀"更适合形容近期的 TTS(Text-To-Speech,文本转语音)模型领域了。 开年以来,从科技巨头到创业公司再到研究机构,都在发力 TTS 模型。2 月,字节跳动海外实验 室推出一款轻量级 TTS 模型 MegaTTS3-Global;3 月,出门问问联合香港科技大学、上海交通 大学、南洋理工大学、西北工业大学等顶尖学术机构,共同开源新一代语音生成模型 Spark- TTS;同月,OpenAI 推出基于 GPT-4o-mini 架构的 TTS 模型。 与 AI 领域其他热门技术相比,TTS 似乎格外低调,但它却是智能硬件、数字人等场景的"隐形基 石"。凭借广泛的应用领域和开阔的商业前景,TTS 在最近一年取得了长足的进步,并悄然改变 着行业规则。 最近,TTS 模型又有重磅"上新",Speech-02语音模型一出手,就将 OpenAI、ElevenLabs 甩在 了后面,登顶 Arena 榜单,成为全球第一。 | Creator | | Model | Arena ELO | 95% CI | # Appearances | | --- | --- | --- | - ...