Agora's Conversational AI Engine
搜索文档
Agora and MiniMax Deepen Global Collaboration Following MiniMax IPO to Power Real-Time Conversational AI at Scale
Prnewswire· 2026-01-20 23:00
合作核心与战略意义 - 声网与MiniMax深化战略合作 整合MiniMax尖端文本转语音及多模态基础模型与声网对话式AI引擎及全球超低延迟实时传输网络 旨在为全球开发者和企业提供具备真实感、响应性和拟人化的对话式AI部署方案 [1] - 合作旨在解决行业关键痛点 即如何将高质量AI输出转化为跨多样设备和不可预测网络的自然、实时交互 标志着行业从单纯追求模型智能向注重实时交互体验的转折点 [3] - 此次合作不仅是技术整合 更是具备全球就绪性的设计 结合MiniMax“天生全球化”的AI模型与声网覆盖**200多个**国家和地区的“交付全球化”基础设施 以解决AI语音在全球范围内一致、自然交付的生态缺口 [6][9] 技术整合与解决方案 - 技术整合的关键在于将MiniMax TTS模型与声网对话式AI引擎及实时音频管道结合 实现AI语音的动态流式传输、打断、恢复和适配 以匹配人类对话模式而非静态播放 [5] - MiniMax的TTS模型专为富有表现力、可控制且情感丰富的语音生成而设计 支持多种语言、音调和说话风格 [4] - 声网提供经过实战检验的全球实时网络 旨在实现亚秒级延迟、抖动控制和大规模电信级可靠性 [9] - 联合解决方案为开发者提供从文本生成到实时语音交付的端到端对话式AI基础 无需开发者自行拼接模型、播放引擎和网络层 [7] 目标应用场景 - 联合方案已支持多个生产级用例 包括需要即时语音反馈的AI伴侣和智能设备、用于客户服务和企业工作流的实时对话代理、要求自然语音和全球覆盖的互动教育及内容平台 以及语音需与视觉、情感和动作同步的多模态AI应用 [10] 公司高层观点 - 声网联合创始人兼首席营收官Tony Wang指出 对话式AI的真正威力在于智能与即时性的结合 MiniMax提供世界级语音生成 声网确保语音在全球任何地方即时、自然、可靠地送达 共同助力开发者从演示迈向真实、可扩展的产品 [11] - MiniMax全球业务副总裁Linda Sheng表示 与声网合作使其模型能在实时环境中发挥最佳性能 解锁同时需要表现力AI和无妥协交付的全球用例 [11] 合作背景与公司概况 - 此次合作深化紧随MiniMax近期完成IPO之后 双方计划进一步拓展在实时语音代理、AI原生设备和多模态对话体验等领域的合作 支持开发者和企业将AI从云端融入日常互动场景 [12] - 声网是实时互动领域的全球领导者 为开发者提供API以嵌入对话式AI、语音、视频等功能 其服务被全球超过**1800家**领先组织所采用 [13] - MiniMax是一家全球AI基础模型公司 其专有多模态模型(如MiniMax M2, Hailuo 2.3等)具备先进的编码能力、高自主代理性能和超长上下文处理能力 支持文本、音频、图像、视频和音乐等多种模态 [14][15] - 截至新闻发布时 MiniMax的专有模型和AI原生产品已累计服务超过**2.12亿**个人用户 覆盖**200多个**国家和地区 以及超过**10万**家企业与开发者 覆盖**100多个**国家和地区 [16]
Agora Builds on Exotel's AgentStream to Deliver Real-Time AI Voice Bots
Prnewswire· 2025-10-16 02:30
合作核心内容 - Agora将其对话式AI引擎与Exotel的AgentStream平台集成,旨在实现跨PSTN和IP渠道的即插即用AI语音机器人 [1] - 该集成解决方案结合了Agora的AI引擎和Exotel的可编程语音流平台,使企业能够大规模提供自然、实时的对话体验 [1][2] - 此次合作标志着在印度和中东等高增长市场推进企业级语音AI应用的关键里程碑 [6] 市场定位与目标 - 合作双方目标在印度和中东市场实现每年5000万至1亿次AI主导的语音交互 [4] - 该解决方案旨在帮助企业自动化30%至40%的常规语音查询,并将运营成本降低高达30% [4] - Exotel平台已获得全球7000多家企业信任,年处理对话量超过250亿次 [3][8] 技术优势与特点 - Exotel AgentStream是一个实时语音流平台,可连接AI机器人与用户,支持PSTN、WhatsApp、应用内和WebRTC等多种渠道 [2] - Agora的对话式AI引擎使开发者能够利用任何大语言模型构建逼真的实时语音代理,具备超低延迟响应和智能中断处理能力 [7] - 该技术即使在网络条件差和嘈杂环境中也能实现更自然的对话 [7] 客户行业覆盖 - 解决方案服务的行业广泛,包括BFSI、物流、耐用消费品、电子商务、医疗保健和教育等 [3][9] - 通过此合作,印度和中东的企业可利用可靠、安全且智能的语音AI基础设施来提升客户满意度 [3]