声网(API)
搜索文档
Agora and Akool Launch Conversational AI + Streaming Avatar Collaboration
Prnewswire· 2025-11-07 00:59
合作核心内容 - Agora公司与Akool公司宣布达成战略合作,将Akool的流媒体虚拟形象技术整合进Agora的对话式AI生态系统 [2] - 此次合作使开发者能够将富有表现力的实时AI虚拟形象嵌入到语音、视频和聊天应用中 [2] - 合作旨在提升互动体验,为人性化交互解锁新的可能性 [2] 合作细节与整合亮点 - Agora的对话式AI引擎现已支持Akool作为测试版虚拟形象提供商 [9] - 整合后的技术能创造与语音、面部表情和手势同步的富有创意且逼真的虚拟形象 [9] - 使用Agora API的开发者可以选择Akool作为其虚拟形象提供商,并快速在应用中配置虚拟形象设置 [9] 合作目标与战略意义 - 此次合作提升了Agora作为支持尖端对话体验平台的地位,同时为Akool提供了将其虚拟形象技术扩展到多样化实时应用的途径 [6] - 整合通过结合语音和视觉存在,提升了对话式应用的能力 [3] - 两家公司将通过技术演示、开发者资源和营销活动共同推广此整合 [6] 应用场景 - 虚拟主持人和能“看见并说话”的AI代理,而非仅仅说话 [9] - 虚拟形象能够动态呈现或叙述的增强型直播和网络研讨会 [9] - 配备富有表现力虚拟形象以增加信任和参与度的客户支持机器人 [9] - 使用虚拟形象提供更人性化、互动性更强的课程的教育平台 [9] 公司背景 - Agora公司是全球实时互动平台领导者,为开发者提供简单、灵活、强大的API,以嵌入实时对话式AI、语音、视频、互动直播和聊天功能到其应用和物联网设备中 [8] - Agora公司总部位于加州圣克拉拉,全球超过1,800家领先组织信赖其技术 [8] - Akool公司是一个全栈AI视频生成平台,使创作者、教育工作者和企业能够制作实时、富有表现力的虚拟形象和视频内容 [7]
Agora, Inc. to Report Third Quarter 2025 Financial Results on November 19, 2025
Globenewswire· 2025-11-06 20:00
财务业绩发布安排 - 公司将于2025年11月19日美国市场收盘后发布2025年第三季度财务业绩 [1] - 公司将于太平洋时间当日下午5点(美国东部时间晚上8点)举行电话会议讨论业绩 [1] - 电话会议可通过指定链接参与,投资者需至少提前15分钟登录 [1] 投资者关系信息 - 业绩公告及相关演示材料将于2025年11月19日在公司投资者关系网站发布 [2] - 投资者可通过指定链接预先注册电话会议 [2] 公司业务概况 - 公司是对话式人工智能和实时互动平台即服务的先驱和全球领导者 [3] - 公司业务分为Agora和声网两个独立运营部分 [3] - Agora总部位于美国圣克拉拉,为开发者提供嵌入实时对话AI、视频、语音、聊天和互动直播的API [3] - 声网总部位于中国上海,是中国市场领先的对话式AI和实时互动PaaS提供商 [4]
对话式AI,等待下一次「万亿时刻」
36氪· 2025-11-05 17:20
对话式AI市场趋势与需求 - 2025年67%的企业将对话式AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入[1] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲的市场需求[2] - 对话式AI整合了大语言模型、自动语音识别、文字转语音、实时互动等技术,使AI能像人类一样自然、真实、流畅对话[4] 对话式AI的技术挑战与解决方案 - 人类对话中仅有7%的信息来自语言内容,超过90%的信息感知来自语调、表情、肢体语言等非语言要素[13] - 目前大部分对话式AI的端到端延迟普遍在3秒以上,而人类之间聊天的延迟正常一般在400毫秒左右[14] - 技术挑战概括为低延迟响应、自然打断、上下文管理、情感理解与表达等,行业主流技术方案是级联模式[16] - 声网发布下一代对话式AI引擎2.0,能够实现端到端高速响应和超低延迟,并内置智能打断、声纹识别等先进功能[18] 对话式AI评估框架与工具 - 声网提出"三维二轨"评估框架,"三维"考核AI的理解能力、表达能力、交互能力,"二轨"包括基准测试和用户导向测试[20] - 声网提供AI模型评测平台,通过模拟真实对话的交互测试,在全球十大城市节点动态监测并更新数据,直观对比主流模型的实时性能[23] - 开发者可在评测平台上针对特定场景横向评测不同模型在响应延迟等方面的性能表现,以选择更匹配自身业务的模型组合[24] 对话式AI的应用场景与落地 - 对话式AI已在智能硬件、情感陪伴、在线教育三大场景中率先实现规模化落地[27] - 2025年被视为AI硬件的爆发元年,对话式AI赋予硬件类人的灵魂和智慧,应用场景包括AI语音助手、AI社交陪伴、AI潮玩等[28][31] - 在教育领域,对话式AI让口语陪练更拟人,并衍生出AI双师,促进教育资源的平等[33] 对话式AI的未来展望与意义 - 未来对话式AI将在多模态交互上实现质的飞跃,并可能发展成多智能体协同的"超级助手"[34] - 对话式AI彻底改变了人类与机器沟通的底层逻辑,从图形界面交互进化到更符合人类本能的交流方式,实现AI平权和技术普惠[35] - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为行业不可或缺的基础设施[36]
对话式AI,等待下一次「万亿时刻」
36氪· 2025-11-05 14:49
市场趋势与需求 - 2025年67%的企业将对话式AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [1] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,市场需求强劲 [1] - 2025年被视为AI硬件的爆发元年,对话式AI在智能硬件、情感陪伴、在线教育三大场景中率先实现规模化落地 [15] 技术挑战与行业痛点 - 目前仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到不可接受 [4] - 人类对话中超过90%的信息感知来自语调、表情等非语言要素,对AI技术提出高要求 [4] - 大部分对话式AI的端到端延迟普遍在3秒以上,而人类聊天延迟正常在400毫秒左右,构成一大痛点 [4] - AI易因环境噪音或用户迟疑而打断,上下文中断影响交互体验 [5] 主流技术方案与产品 - 行业主流技术方案为级联模式,将语音对话拆解为ASR—LLM—TTS三个串行步骤 [6] - 声网围绕级联模式推出三类产品形态:下一代对话式AI引擎2.0、模块化SDK、以及面向现有客户的扩展套件 [6][8] - 引擎2.0依托全球实时网络实现超低延迟,内置智能打断、声纹识别等功能,支持多种主流大模型 [8] 评估框架与工具 - 声网发布白皮书提出三维二轨评估框架,三维考核AI的理解、表达、交互能力,二轨包括基准测试和用户导向测试 [9][10] - 声网提供AI模型评测平台,通过模拟真实对话在全球十大城市节点动态监测数据,对比主流ASR、LLM和TTS模型性能 [13] 应用场景与生态 - 对话式AI已广泛应用于AI陪伴硬件、AI社交应用、AI教育硬件、AI客服、AI口语陪练、AI招聘、AI助教、AI医疗健康、AI游戏、AI翻译等十余个场景 [17] - 在情感陪伴领域,对话式AI使AI具备记忆力、个性和共情能力,成为社交引擎 [19] - 在教育领域,对话式AI让口语陪练更拟人,并衍生出AI双师模式,促进教育资源平等 [19] 未来发展趋势 - 对话式AI未来将在多模态交互上实现飞跃,实现边听边说、看懂表情手势等功能,人机交互接近人人交互 [19] - 未来对话式AI可能从单点工具发展为多智能体协同的超级助手,融入业务流程成为数字员工或信息入口 [20] - 技术将降低AI使用门槛,实现AI平权和技术普惠,帮助人类从繁琐任务中解放,专注于创造性工作 [21] 行业里程碑 - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为行业不可或缺的基础设施 [22]
年度服务时长首破万亿分钟,声网乘对话式AI东风
搜狐财经· 2025-11-03 21:17
公司战略与产品动态 - 公司年度服务分钟数首次突破1万亿分钟,并发布多款对话式AI新品 [1] - 公司将对话式AI作为长期战略投入,OpenAI推出实时交互API是重要风向标 [3] - 公司推出对话式AI引擎2.0,能分辨讲话时机和讲话人,支持更多ASR和TTS供应商,并允许用户自定义语种和音色 [4] - 公司发布对话式AI Studio编排平台和开发套件,旨在帮助客户和开发者快速集成对话式AI能力 [4] - 2025年第二季度公司营收3430万美元,同比增长0.5%,净利润150万美元,实现同比扭亏 [5] 行业趋势与市场机遇 - 多模态大语言模型使计算机具备类人实时语音对话能力,67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [1] - 对话式AI的典型技术框架包括声音代理、自动语音识别、大语言模型处理和文本转语音等环节,每个环节都存在技术升级空间 [3] - AI语音助手、AI社交和陪伴、AI潮玩是当前对话式AI应用排名前三的热门场景 [4] - 人类对话中超过90%的信息感知依赖于语调、表情等非语言要素,实现真正的“类人对话”需攻克低延迟、自然打断、情感理解等挑战 [5] - 对话式AI被视为下一代AI基础设施的重要组成部分,以AI陪伴为例,其市场规模预测将从3000万美元增长至700亿-1500亿美元 [5] - 公司对话式AI相关用量在2025年第三季度实现151%的环比增长 [5]
实时互动产业迈入“万亿分钟”时代 对话式AI催生千亿新蓝海
中国经济网· 2025-11-03 16:37
行业宏观趋势 - 实时互动行业年度服务分钟数首次突破1万亿分钟,标志着该技术已成为关键基础设施 [1] - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80% [1] - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [2] - 对话式AI与语音智能体创业公司呈现爆发式增长态势 [2] 技术发展现状与挑战 - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI” [1] - 实时互动在环境感知与交互自然度上存在明显缺陷,仅21%的用户对现有AI对话体验满意 [1] - 实现“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战 [1] - 多模态大语言模型的出现为计算机提供了类人的实时语音对话能力,为解决挑战带来新路径 [1] 市场需求与公司表现 - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲市场需求 [2] - 对话式AI正驱动实时互动从能够“正常对话”到“声情并茂”的关键跃迁,带来不可估量的新市场 [1] 公司战略与产品发布 - 声网发布《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供系统实践指南 [2] - 声网推出对话式AI引擎2.0,包含开发套件、模型评测平台和对话式AI Studio,加速应用创新 [2] - 公司将继续与开发者、企业及合作伙伴共同推动实时互动生态进化,迎接智能交互新时代 [2]
从“连接”到“对话”:RTE+AI重塑交互,声网等抢占新赛道?
搜狐财经· 2025-11-02 01:06
RTE行业里程碑与基础设施成熟度 - 声网年度服务分钟数突破万亿,实时互动技术确立关键基础设施地位 [1] - 视频高清化比例过去两年增长超10倍,海外市场720p以上分辨率流量占比超80% [3] - WebRTC搜索热度爆发式增长,技术基建全面完善支撑万亿分钟服务量 [3] 人机交互挑战与用户满意度 - 交互从人与人延伸至人与AI后,用户满意度仅为21%,暴露出显著体验短板 [3] - 人类对话中90%的信息来自语调、表情等非语言要素,现有技术情感传递存在鸿沟 [3] 对话式AI的市场需求与技术突破 - 67%的企业将语音AI智能体置于战略核心,84%计划增加相关投入 [5] - 声网对话式AI用量单季度环比增长151%,市场需求爆发 [5] - 多模态大语言模型实现RTE从正常对话到声情并茂的跨越 [5] AI融合的规模化应用场景与市场预测 - 情感陪伴、智能硬件、在线教育三大场景显现规模化落地潜力 [5] - ARK Invest预测AI陪伴赛道规模将达700-1500亿美元 [5] - AI客服的现场演示印证了技术在实时交互上的突破 [5] 全球化战略与市场竞争格局 - AI出海从可选项变为必选项,信任是超越技术的核心壁垒 [7] - 成功的全球化需结合技术价值的全球化叙事与情感价值的本地化表达 [7] - 赛道机遇集中于Agent、AI硬件与底层基础设施,形成巨头主导通用场景与原生企业深耕细分领域的两极格局 [7] 技术发展趋势与工具创新 - 行业方向是让伟大技术融于无形,通过降低开发门槛推动技术落地 [9] - 声网发布白皮书与AI引擎2.0等工具套件践行此理念 [9] - RAG技术应用使AI回答具备真实性与可追溯性,为医疗等专业领域融合提供可能 [9] 行业未来展望 - 行业从人人连接向人机共生跃迁,重塑交互边界 [11] - 万亿分钟的基建积淀叠加千亿级AI蓝海市场,开启更智能自然的实时互动新时代 [11]
对话式AI开启RTE行业千亿级新蓝海 AI出海需完成“心智跃迁”
中国经营报· 2025-11-01 21:12
大会核心信息 - 第十一届实时互联网大会在北京开幕,主题为“AI有声”,发布了《2025对话式AI发展白皮书》[1] - 大会汇聚全球RTE和对话式AI专家、开发者、企业代表与生态伙伴,探讨深度融合的新场景、新架构与新机遇[1] - 声网年度服务分钟数首次突破1万亿分钟,标志着RTE技术已成为关键基础设施[1] 实时互动行业趋势 - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80%[1] - WebRTC全球搜索热度呈现爆发式增长,标志着实时互动行业正迎来新一轮创新热潮[1] - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI”[1] 对话式AI发展现状与挑战 - 仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受”[3] - 人类对话中仅有7%的信息来自语言内容,超过90%的信息感知依赖于非语言要素[3] - 实现真正的“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战[3] 对话式AI的市场需求与增长 - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入[4] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长[4] - ARK Invest预测AI陪伴赛道有机会从3000万美元上涨到700亿—1500亿美元[4] 对话式AI的关键应用场景 - 对话式AI将在情感陪伴、智能硬件、在线教育三大场景中率先实现规模化落地[4] - 全球范围内正掀起实时语音技术新浪潮,对话式AI与语音智能体创业公司呈现爆发式增长[4] - 在Y Combinator近期的孵化团队中,语音智能体公司占比显著提升[4] 声网的产品与生态布局 - 声网发布了《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供实践指南[5] - 声网推出了对话式AI引擎2.0、对话式AI开发套件、对话式AI模型评测平台和对话式AI Studio[5] - 公司旨在加速对话式AI在实时互动行业的应用创新,开启RTE+AI的新篇章[5] AI出海战略与市场机遇 - AI出海从“可选项”转变为“必选项”,企业需完成从“算法精度”到“心智广度”的认知跨越[8] - 信任是超越技术的新竞争壁垒,源自透明的数据治理、商业共赢以及文化共情[8] - Agent、AI硬件与底层基础设施正构成三大核心机遇,智能体AI尚处于爆发初期[8] AI出海的竞争策略与执行路径 - 未来将形成两极化的生态格局:巨头主导通用场景,深耕细分领域的AI原生企业能建立坚固护城河[8] - AI硬件企业需通过持续创新保持“6个月到1年”的技术代差,并发挥供应链整合和快速迭代优势[9] - 市场策略可多元化,包括做深本地化、做深行业,或采用“声西击东”的创新策略[9] 技术发展的核心观点 - 真正伟大的技术应当“融于无形”,成功源于对技术的深刻理解并基于此满足用户需求[5] - 企业需要构建能够有机协同人类与AI Agent的组织形态,个体需具备指挥“AI大军”的能力[6][7] - 技术的真正力量在于“无之以为用”,应重视数据安全、流程再造、组织文化等短板[7]
声网创始人赵斌:RTE年服务时长超1万亿分钟,已成不可或缺基础设施
新浪财经· 2025-11-01 11:47
行业规模与基础设施地位 - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为关键基础设施 [1] - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比超过80% [1] - WebRTC全球搜索热度呈现爆发式增长,实时互动行业正迎来新一轮创新热潮 [1] 对话式AI的市场需求与增长 - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲市场需求 [4] - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [4] - 对话式AI与语音智能体创业公司呈现爆发式增长,Y Combinator孵化团队中此类公司占比显著提升 [4] 当前技术挑战与发展方向 - 产业面临从“连通”到“对话”的本质挑战,仅21%的用户对现有AI对话体验满意,部分服务用户流失率高 [3] - 人类对话中仅7%信息来自语言内容,超过90%信息感知依赖于语调、表情和肢体语言等非语言要素 [3] - 实现真正“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战 [3]
Agora Partners with Exotel to Scale AI Voice Bots in India and the Middle East
Yahoo Finance· 2025-10-22 19:41
合作公告 - 公司于10月15日宣布与Exotel建立合作,基于Exotel的可编程语音流平台,大规模交付智能实时AI语音机器人 [1] - 此次集成将公司的对话式AI引擎与Exotel的AgentStream平台相连接,覆盖PSTN和IP信道 [1] 合作技术细节 - Exotel AgentStream是一个实时语音流平台,可将AI机器人与用户通过PSTN、WhatsApp、应用内和WebRTC等信道连接 [2] - 该合作使公司技术能专注于提升智能化和提供类人对话体验 [2] - 合作重点在于推动企业级语音AI在高增长的印度和中东市场的应用 [2] 合作目标与市场 - 合作目标是在印度和中东地区每年实现5000万至1亿次AI主导的语音交互 [3] - 该预测基于区域市场增长数据及早期企业试点数据 [3] - Exotel是客户互动AI转型的领先提供商,服务行业包括BFSI、物流、耐用消费品、电子商务、医疗保健和教育 [3] 公司业务概况 - 公司通过子公司在美国、中华人民共和国及全球范围内运营实时互动平台即服务(PaaS) [4]