Workflow
TPU AI芯片
icon
搜索文档
速递|两名本科生3个月打造的AI语音模型,挑战谷歌NotebookLM,16亿参数实现自然对话生成
Z Potentials· 2025-04-23 11:49
图片来源: Nari 两名没有高度专业 AI 知识的本科生表示,他们已经创建了一个公开可用的 AI 模型,可以生成类似 于 Google 的 NotebookLM 的播客风格的剪辑。 合成语音工具的市场巨大,并且还在不断增长。 ElevenLabs 是最大的参与者之一,但不乏挑战者 (参见 PlayAI 、 Sesame 等)。投资者认为这些工具具有巨大的潜力。 根据 PitchBook 的数据 ,开发语音 AI 技术的初创公司去年筹集了超过 3.98 亿美元的风险投资。 Nari Labs 是新发布模型背后的团队,总部位于韩国的联合创始人之一 Toby Kim 表示,他和他的同事 在三个月前开始学习语音 AI 。受 NotebookLM 的启发,他们希望创建一个模型,该模型可以更好地 控制生成的声音和 " 脚本中的自由度 " 。 Kim 说,他们使用了 Google 的 TPU Research Cloud 计划来训练 Nari 的模型 Dia ,该计划为研究人 员提供了对该公司 TPU AI 芯片的免费访问。 Dia 有 16 亿个参数,可以从脚本中生成对话,让用户 自定义说话者的语气并插入不流畅、咳嗽、 ...