黄仁勋投了家复刻马斯克声音的AI公司

公司融资与产品发布 - Cartesia公司完成1亿美元B轮融资，投资方包括英伟达[1][6] - 公司于3月完成6400万美元A轮融资，并发布支持语音克隆与风格迁移的Sonic-2.0模型[6] - 公司成立第二年即获得种子轮融资，并推出首款语音模型Sonic[6] 核心技术特点 - Sonic-3语音模型基于状态空间模型构建，与传统Transformer架构不同，能持续感知上下文，响应更自然[8] - 模型延迟仅90毫秒，端到端响应时间为190毫秒，是当前最快的语音生成系统之一[8] - 模型能更准确捕捉语言中的情绪波动、笑声、语气起伏等微妙情感变化[8] 创始团队背景 - 公司创始团队核心成员清一色来自斯坦福AI实验室，为学术派班底[3] - 首席执行官Karan Goel为斯坦福AI Lab的印度天才少年，在状态空间模型领域已有研究[2][11] - 首席科学家兼联合创始人Albert Gu为华裔，是Mamba架构的共同发明人之一[4] 行业发展动态 - MiniMax公司发布语音模型MiniMax Speech 2.6，响应延迟压缩到250毫秒以内，支持40多种语言和所有口音[14][16] - 语音模型商业化变现在大模型领域表现突出[16]