声网(API)
搜索文档
对话式AI,等待下一次「万亿时刻」
36氪· 2025-11-05 14:49
市场趋势与需求 - 2025年67%的企业将对话式AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [1] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,市场需求强劲 [1] - 2025年被视为AI硬件的爆发元年,对话式AI在智能硬件、情感陪伴、在线教育三大场景中率先实现规模化落地 [15] 技术挑战与行业痛点 - 目前仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到不可接受 [4] - 人类对话中超过90%的信息感知来自语调、表情等非语言要素,对AI技术提出高要求 [4] - 大部分对话式AI的端到端延迟普遍在3秒以上,而人类聊天延迟正常在400毫秒左右,构成一大痛点 [4] - AI易因环境噪音或用户迟疑而打断,上下文中断影响交互体验 [5] 主流技术方案与产品 - 行业主流技术方案为级联模式,将语音对话拆解为ASR—LLM—TTS三个串行步骤 [6] - 声网围绕级联模式推出三类产品形态:下一代对话式AI引擎2.0、模块化SDK、以及面向现有客户的扩展套件 [6][8] - 引擎2.0依托全球实时网络实现超低延迟,内置智能打断、声纹识别等功能,支持多种主流大模型 [8] 评估框架与工具 - 声网发布白皮书提出三维二轨评估框架,三维考核AI的理解、表达、交互能力,二轨包括基准测试和用户导向测试 [9][10] - 声网提供AI模型评测平台,通过模拟真实对话在全球十大城市节点动态监测数据,对比主流ASR、LLM和TTS模型性能 [13] 应用场景与生态 - 对话式AI已广泛应用于AI陪伴硬件、AI社交应用、AI教育硬件、AI客服、AI口语陪练、AI招聘、AI助教、AI医疗健康、AI游戏、AI翻译等十余个场景 [17] - 在情感陪伴领域,对话式AI使AI具备记忆力、个性和共情能力,成为社交引擎 [19] - 在教育领域,对话式AI让口语陪练更拟人,并衍生出AI双师模式,促进教育资源平等 [19] 未来发展趋势 - 对话式AI未来将在多模态交互上实现飞跃,实现边听边说、看懂表情手势等功能,人机交互接近人人交互 [19] - 未来对话式AI可能从单点工具发展为多智能体协同的超级助手,融入业务流程成为数字员工或信息入口 [20] - 技术将降低AI使用门槛,实现AI平权和技术普惠,帮助人类从繁琐任务中解放,专注于创造性工作 [21] 行业里程碑 - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为行业不可或缺的基础设施 [22]
年度服务时长首破万亿分钟,声网乘对话式AI东风
搜狐财经· 2025-11-03 21:17
公司战略与产品动态 - 公司年度服务分钟数首次突破1万亿分钟,并发布多款对话式AI新品 [1] - 公司将对话式AI作为长期战略投入,OpenAI推出实时交互API是重要风向标 [3] - 公司推出对话式AI引擎2.0,能分辨讲话时机和讲话人,支持更多ASR和TTS供应商,并允许用户自定义语种和音色 [4] - 公司发布对话式AI Studio编排平台和开发套件,旨在帮助客户和开发者快速集成对话式AI能力 [4] - 2025年第二季度公司营收3430万美元,同比增长0.5%,净利润150万美元,实现同比扭亏 [5] 行业趋势与市场机遇 - 多模态大语言模型使计算机具备类人实时语音对话能力,67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [1] - 对话式AI的典型技术框架包括声音代理、自动语音识别、大语言模型处理和文本转语音等环节,每个环节都存在技术升级空间 [3] - AI语音助手、AI社交和陪伴、AI潮玩是当前对话式AI应用排名前三的热门场景 [4] - 人类对话中超过90%的信息感知依赖于语调、表情等非语言要素,实现真正的“类人对话”需攻克低延迟、自然打断、情感理解等挑战 [5] - 对话式AI被视为下一代AI基础设施的重要组成部分,以AI陪伴为例,其市场规模预测将从3000万美元增长至700亿-1500亿美元 [5] - 公司对话式AI相关用量在2025年第三季度实现151%的环比增长 [5]
实时互动产业迈入“万亿分钟”时代 对话式AI催生千亿新蓝海
中国经济网· 2025-11-03 16:37
行业宏观趋势 - 实时互动行业年度服务分钟数首次突破1万亿分钟,标志着该技术已成为关键基础设施 [1] - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80% [1] - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [2] - 对话式AI与语音智能体创业公司呈现爆发式增长态势 [2] 技术发展现状与挑战 - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI” [1] - 实时互动在环境感知与交互自然度上存在明显缺陷,仅21%的用户对现有AI对话体验满意 [1] - 实现“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战 [1] - 多模态大语言模型的出现为计算机提供了类人的实时语音对话能力,为解决挑战带来新路径 [1] 市场需求与公司表现 - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲市场需求 [2] - 对话式AI正驱动实时互动从能够“正常对话”到“声情并茂”的关键跃迁,带来不可估量的新市场 [1] 公司战略与产品发布 - 声网发布《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供系统实践指南 [2] - 声网推出对话式AI引擎2.0,包含开发套件、模型评测平台和对话式AI Studio,加速应用创新 [2] - 公司将继续与开发者、企业及合作伙伴共同推动实时互动生态进化,迎接智能交互新时代 [2]
从“连接”到“对话”:RTE+AI重塑交互,声网等抢占新赛道?
搜狐财经· 2025-11-02 01:06
RTE行业里程碑与基础设施成熟度 - 声网年度服务分钟数突破万亿,实时互动技术确立关键基础设施地位 [1] - 视频高清化比例过去两年增长超10倍,海外市场720p以上分辨率流量占比超80% [3] - WebRTC搜索热度爆发式增长,技术基建全面完善支撑万亿分钟服务量 [3] 人机交互挑战与用户满意度 - 交互从人与人延伸至人与AI后,用户满意度仅为21%,暴露出显著体验短板 [3] - 人类对话中90%的信息来自语调、表情等非语言要素,现有技术情感传递存在鸿沟 [3] 对话式AI的市场需求与技术突破 - 67%的企业将语音AI智能体置于战略核心,84%计划增加相关投入 [5] - 声网对话式AI用量单季度环比增长151%,市场需求爆发 [5] - 多模态大语言模型实现RTE从正常对话到声情并茂的跨越 [5] AI融合的规模化应用场景与市场预测 - 情感陪伴、智能硬件、在线教育三大场景显现规模化落地潜力 [5] - ARK Invest预测AI陪伴赛道规模将达700-1500亿美元 [5] - AI客服的现场演示印证了技术在实时交互上的突破 [5] 全球化战略与市场竞争格局 - AI出海从可选项变为必选项,信任是超越技术的核心壁垒 [7] - 成功的全球化需结合技术价值的全球化叙事与情感价值的本地化表达 [7] - 赛道机遇集中于Agent、AI硬件与底层基础设施,形成巨头主导通用场景与原生企业深耕细分领域的两极格局 [7] 技术发展趋势与工具创新 - 行业方向是让伟大技术融于无形,通过降低开发门槛推动技术落地 [9] - 声网发布白皮书与AI引擎2.0等工具套件践行此理念 [9] - RAG技术应用使AI回答具备真实性与可追溯性,为医疗等专业领域融合提供可能 [9] 行业未来展望 - 行业从人人连接向人机共生跃迁,重塑交互边界 [11] - 万亿分钟的基建积淀叠加千亿级AI蓝海市场,开启更智能自然的实时互动新时代 [11]
对话式AI开启RTE行业千亿级新蓝海 AI出海需完成“心智跃迁”
中国经营报· 2025-11-01 21:12
大会核心信息 - 第十一届实时互联网大会在北京开幕,主题为“AI有声”,发布了《2025对话式AI发展白皮书》[1] - 大会汇聚全球RTE和对话式AI专家、开发者、企业代表与生态伙伴,探讨深度融合的新场景、新架构与新机遇[1] - 声网年度服务分钟数首次突破1万亿分钟,标志着RTE技术已成为关键基础设施[1] 实时互动行业趋势 - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80%[1] - WebRTC全球搜索热度呈现爆发式增长,标志着实时互动行业正迎来新一轮创新热潮[1] - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI”[1] 对话式AI发展现状与挑战 - 仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受”[3] - 人类对话中仅有7%的信息来自语言内容,超过90%的信息感知依赖于非语言要素[3] - 实现真正的“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战[3] 对话式AI的市场需求与增长 - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入[4] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长[4] - ARK Invest预测AI陪伴赛道有机会从3000万美元上涨到700亿—1500亿美元[4] 对话式AI的关键应用场景 - 对话式AI将在情感陪伴、智能硬件、在线教育三大场景中率先实现规模化落地[4] - 全球范围内正掀起实时语音技术新浪潮,对话式AI与语音智能体创业公司呈现爆发式增长[4] - 在Y Combinator近期的孵化团队中,语音智能体公司占比显著提升[4] 声网的产品与生态布局 - 声网发布了《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供实践指南[5] - 声网推出了对话式AI引擎2.0、对话式AI开发套件、对话式AI模型评测平台和对话式AI Studio[5] - 公司旨在加速对话式AI在实时互动行业的应用创新,开启RTE+AI的新篇章[5] AI出海战略与市场机遇 - AI出海从“可选项”转变为“必选项”,企业需完成从“算法精度”到“心智广度”的认知跨越[8] - 信任是超越技术的新竞争壁垒,源自透明的数据治理、商业共赢以及文化共情[8] - Agent、AI硬件与底层基础设施正构成三大核心机遇,智能体AI尚处于爆发初期[8] AI出海的竞争策略与执行路径 - 未来将形成两极化的生态格局:巨头主导通用场景,深耕细分领域的AI原生企业能建立坚固护城河[8] - AI硬件企业需通过持续创新保持“6个月到1年”的技术代差,并发挥供应链整合和快速迭代优势[9] - 市场策略可多元化,包括做深本地化、做深行业,或采用“声西击东”的创新策略[9] 技术发展的核心观点 - 真正伟大的技术应当“融于无形”,成功源于对技术的深刻理解并基于此满足用户需求[5] - 企业需要构建能够有机协同人类与AI Agent的组织形态,个体需具备指挥“AI大军”的能力[6][7] - 技术的真正力量在于“无之以为用”,应重视数据安全、流程再造、组织文化等短板[7]
声网创始人赵斌:RTE年服务时长超1万亿分钟,已成不可或缺基础设施
新浪财经· 2025-11-01 11:47
行业规模与基础设施地位 - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为关键基础设施 [1] - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比超过80% [1] - WebRTC全球搜索热度呈现爆发式增长,实时互动行业正迎来新一轮创新热潮 [1] 对话式AI的市场需求与增长 - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲市场需求 [4] - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [4] - 对话式AI与语音智能体创业公司呈现爆发式增长,Y Combinator孵化团队中此类公司占比显著提升 [4] 当前技术挑战与发展方向 - 产业面临从“连通”到“对话”的本质挑战,仅21%的用户对现有AI对话体验满意,部分服务用户流失率高 [3] - 人类对话中仅7%信息来自语言内容,超过90%信息感知依赖于语调、表情和肢体语言等非语言要素 [3] - 实现真正“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战 [3]
Agora Partners with Exotel to Scale AI Voice Bots in India and the Middle East
Yahoo Finance· 2025-10-22 19:41
合作公告 - 公司于10月15日宣布与Exotel建立合作,基于Exotel的可编程语音流平台,大规模交付智能实时AI语音机器人 [1] - 此次集成将公司的对话式AI引擎与Exotel的AgentStream平台相连接,覆盖PSTN和IP信道 [1] 合作技术细节 - Exotel AgentStream是一个实时语音流平台,可将AI机器人与用户通过PSTN、WhatsApp、应用内和WebRTC等信道连接 [2] - 该合作使公司技术能专注于提升智能化和提供类人对话体验 [2] - 合作重点在于推动企业级语音AI在高增长的印度和中东市场的应用 [2] 合作目标与市场 - 合作目标是在印度和中东地区每年实现5000万至1亿次AI主导的语音交互 [3] - 该预测基于区域市场增长数据及早期企业试点数据 [3] - Exotel是客户互动AI转型的领先提供商,服务行业包括BFSI、物流、耐用消费品、电子商务、医疗保健和教育 [3] 公司业务概况 - 公司通过子公司在美国、中华人民共和国及全球范围内运营实时互动平台即服务(PaaS) [4]
Agora Builds on Exotel's AgentStream to Deliver Real-Time AI Voice Bots
Prnewswire· 2025-10-16 02:30
合作核心内容 - Agora将其对话式AI引擎与Exotel的AgentStream平台集成,旨在实现跨PSTN和IP渠道的即插即用AI语音机器人 [1] - 该集成解决方案结合了Agora的AI引擎和Exotel的可编程语音流平台,使企业能够大规模提供自然、实时的对话体验 [1][2] - 此次合作标志着在印度和中东等高增长市场推进企业级语音AI应用的关键里程碑 [6] 市场定位与目标 - 合作双方目标在印度和中东市场实现每年5000万至1亿次AI主导的语音交互 [4] - 该解决方案旨在帮助企业自动化30%至40%的常规语音查询,并将运营成本降低高达30% [4] - Exotel平台已获得全球7000多家企业信任,年处理对话量超过250亿次 [3][8] 技术优势与特点 - Exotel AgentStream是一个实时语音流平台,可连接AI机器人与用户,支持PSTN、WhatsApp、应用内和WebRTC等多种渠道 [2] - Agora的对话式AI引擎使开发者能够利用任何大语言模型构建逼真的实时语音代理,具备超低延迟响应和智能中断处理能力 [7] - 该技术即使在网络条件差和嘈杂环境中也能实现更自然的对话 [7] 客户行业覆盖 - 解决方案服务的行业广泛,包括BFSI、物流、耐用消费品、电子商务、医疗保健和教育等 [3][9] - 通过此合作,印度和中东的企业可利用可靠、安全且智能的语音AI基础设施来提升客户满意度 [3]
Agora Brings 4G Connectivity, Visual Intelligence, and Faster Prototyping to Smart Hardware Kit
Prnewswire· 2025-09-24 21:02
公司产品发布 - Agora公司发布了新一代Convo AI设备开发套件 该套件引入了原生4G连接、增强的多模态交互、具备视觉智能的摄像头以及快速原型制作能力 [2] - 新一代开发套件使开发者能够在一小时内创建基于大语言模型的AI设备演示版 并在一天内完成生产就绪的原型 显著缩短产品上市时间 [3] - 该套件旨在为下一代智能伴侣、教育机器人、联网玩具和AI学习设备提供支持 使开发者能够更快、更具成本效益地交付全球互联的移动AI设备体验 [5] 产品核心功能 - 具备超低延迟、清晰音频、说话人识别和可定制唤醒词等功能 以实现无缝、逼真的交互和陪伴 [7] - 内置摄像头赋予AI视觉能力 以识别和解释图像 实现更智能、更沉浸式的交互 [7] - 提供实时表情眼神反馈 与语音同步 支持双屏和单屏设备设计 [7] - 集成G传感器、NFC和振动电机 可实现更直观、更具吸引力的设备交互 [7] 技术规格与兼容性 - 套件提供全球4G连接支持 原生支持Nano-SIM和eSIM 覆盖北美、拉丁美洲、欧洲、印度、中东、中国和东南亚等地区 [7] - 套件与广泛的自动语音识别、文本转语音和大语言模型供应商兼容 并支持Wi-Fi、Cat1和ISP芯片组 实现灵活部署 [7] 管理层与合作伙伴评价 - 公司首席执行官表示 该套件旨在创建一个开放的硬件生态系统 用于构建真正移动、多模态且能在极短时间内实现生产就绪的对话式AI设备 [4] - 合作伙伴Robopoet公司首席技术官评价称 该套件为其设备提供了超低延迟语音交互和全球连接能力 使AI对话能够随时随地响应 [5] 公司背景信息 - Agora是实时互动领域的全球领导者 为开发者提供简单、灵活且强大的API 将实时对话式AI、语音、视频、互动直播和聊天嵌入其应用和物联网设备 [6] - 公司总部位于加利福尼亚州圣克拉拉 全球超过1700家领先组织信赖其技术 为其社交电商、教育、远程医疗等场景提供一流的实时体验 [6]
Agora, Inc. (API) Unveils Advanced AR and AI Video Capabilities
Insider Monkey· 2025-09-20 02:49
AI能源需求激增 - AI是史上最耗电的技术 每个驱动大型语言模型的数据中心耗电量相当于一个小型城市 [2] - AI查询 模型更新和机器人突破消耗大量能源 正在将全球电网推向崩溃边缘 [1][2] - OpenAI创始人和Elon Musk均警告AI发展面临能源瓶颈 需要能源突破否则明年将耗尽电力 [2] 被低估的基础设施公司 - 一家鲜为人知的公司拥有关键能源基础设施资产 定位为AI能源需求激增的受益者 [3] - 公司业务覆盖核能基础设施 是美国下一代电力战略的核心参与者 [7] - 公司是全球少数能执行大型复杂EPC项目的企业 业务横跨油气 可再生燃料和工业基础设施 [7] 多重增长催化剂 - 公司在美国LNG出口领域扮演关键角色 特朗普"美国优先"能源政策将推动该板块爆发 [7] - 特朗普关税政策推动制造业回流 公司将优先获得设施重建和改造项目 [5] - 公司还持有另一家热门AI公司的重大股权 为投资者提供多重AI增长引擎 exposure [9] 卓越财务状况 - 公司完全无负债 与背负巨额债务的能源和公用事业公司形成鲜明对比 [8] - 公司持有大量现金储备 相当于其总市值的近三分之一 [8] - 剔除现金和投资后 公司交易市盈率不足7倍 估值极具吸引力 [10] 机构关注与增长潜力 - 全球最隐秘的对冲基金经理开始在闭门投资峰会上推荐该股票 [9] - 公司被预测在12-24个月内具有100%以上的上涨潜力 [15][19] - 华尔街刚开始注意到这家公司 其估值尚未反映多重顺风因素 [8]