Workflow
这才是现在最强的AI声音模型。
数字生命卡兹克·2025-05-15 23:40

几个月前,我写过一篇MiniMax的AI声音模型。 我说,那就是当时最强的中文AI音频。数据也有点小爆。 而在去年12月之后,至今将近半年时间,在AI声音模型这块,我觉得还是没有能超越MiniMax的。 直到昨天,我看到 MiniMax在X上发了他们新一代声音模型的技术报告,Speech-02来了。看来想突破Speech-01的上限,还是得他们自己。 | MiniMax (official) & | ... | | --- | --- | | @MiniMax AI | | | | Language | WER J | | SIM ↑ | | | --- | --- | --- | --- | --- | --- | | | | MiniMax | 11LABS | MiniMax | 11LABS | | | Chinese | 2.252 | 16.026 | 0.780 | 0.677 | | | English | 2.164 | 2.339 | 0.756 | 0.613 | | | Cantonese | 34.111 | 51.513 | 0.778 | 0.670 | | | Japanese ...