Deepgram Launches Streaming Speech, Text, and Voice Agents on Amazon SageMaker AI
亚马逊亚马逊(US:AMZN) Businesswire·2025-12-01 11:00

核心观点 - Deepgram作为语音AI平台 宣布其流式语音转文本 文本转语音及语音代理API与亚马逊SageMaker AI实现原生集成 使企业能够在AWS工作流中直接部署和扩展低延迟语音应用 [1][2] 产品与技术整合 - 该集成将Deepgram的流式语音模型作为Amazon SageMaker AI的实时端点提供 无需定制管道或编排 即可实现亚秒级延迟的语音转文本 文本转语音和语音代理功能 [1][2] - 通过SageMaker API进行原生流式传输 意味着无需变通方案即可获得清晰的实时推理 该集成能为呼叫中心 交易大厅和实时分析等高规模用例提供亚秒级延迟和企业级可靠性 [3] - 该解决方案构建于AWS之上 支持通过InvokeEndpointWithResponseStream实现流式响应 并将数据保留在AWS内部 客户可将其部署在亚马逊虚拟私有云中或作为托管服务 以满足严格的数据驻留和合规要求 [4] 市场与客户价值 - 此次集成使团队能够在现有AWS工作流中构建 部署和扩展语音驱动应用 同时保持AWS环境的安全与合规优势 [1] - 该集成移除了部署实时语音功能的复杂性 让AWS客户能专注于创新而非基础设施 通过将先进的语音模型直接带入企业已运营的AWS环境 极大简化了企业创建变革性语音体验的流程 [5] - 超过20万名开发者因Deepgram无与伦比的准确性 低延迟和定价 而使用其语音原生基础模型 这些模型可通过云API或自托管/本地API访问 [7] 合作伙伴关系 - Deepgram与AWS建立了牢固的合作关系 是AWS生成式AI能力合作伙伴 并与AWS签署了多年期战略合作协议 以加速企业采用 [5] - AWS SageMaker总经理表示 此集成是Deepgram通过AWS服务使生成式AI更易获取和强大 从而扩大市场覆盖范围的典范 同时使双方客户能够构建复杂的语音应用 [6] 公司背景与行业地位 - Deepgram自称是全球最真实 最实时的语音AI平台 提供语音转文本 文本转语音及完整的语音转语音功能 所有这些都由其企业级运行时提供支持 [1][7] - 客户包括构建语音产品或平台的技术独立软件供应商 与大型企业合作的联合销售合作伙伴 以及解决内部用例的企业 [7] - 公司已处理超过5万年的音频 转录了超过1万亿个单词 声称全球没有比其更懂语音的组织 [7] 近期动态与行业认可 - 该集成将于2025年12月1日至5日在拉斯维加斯AWS re:Invent大会的Deepgram 690号展位进行现场演示 [7] - Deepgram的Aura-2文本转语音模型被TMC的《CUSTOMER》杂志评为2025年客户体验创新奖获奖者 [9][11] - Deepgram在VapiCon 2025上推出了Flux 这是全球首个专为实时语音代理设计的对话式语音识别模型 与传统自动语音识别不同 它经过训练以理解对话的细微差别 [12]