对话式AI开发套件
搜索文档
教AI听懂人话,声网在AI淘金热中“卖铲子”
钛媒体APP· 2025-11-17 10:17
行业趋势与市场前景 - 对话式AI被企业高度重视,67%的企业在2025年已将其置于战略核心,84%的企业计划在未来一年增加相关投入 [1] - AI语音赛道获得密集融资,科技巨头如OpenAI和Google密集发布语音模型或产品 [1] - 对话式AI在情感陪伴、智能硬件、在线教育等场景规模化落地,相关硬件产品如陪伴玩具、智能眼镜、AI耳机成为消费热点 [2] - 根据热力榜单,AI语音助手、AI社交与陪伴、AI潮玩是对话式AI需求最强劲的前三大应用领域 [7] 技术挑战与用户痛点 - 当前AI硬件面临高退货率问题,AI毛绒玩具电商退货率达30%-40%,部分AI眼镜退货率高达40%-50% [2] - 用户体验不佳是主要问题,AI对话被指交互生硬、情感连接弱、同质化严重,体验像机器人“念稿” [2] - 用户满意度低,仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受” [4] - 技术瓶颈包括低延迟响应、自然打断、上下文管理、情感理解与表达,人类对话延迟约400毫秒,而传统语音合成链路延迟可达2-3秒,超过500毫秒会显著损害用户体验 [5] - AI产品需具备防干扰能力,能区分用户指令与环境噪音,并在被打断后流畅回应 [6] 平台型技术公司的发展 - 提供底层语音交互技术的平台型公司在AI产业中角色日益重要 [1] - 实时通信服务商如即构科技、融云、科大讯飞、声网因提供稳定低延迟的实时传输技术而迅速增长 [7][9] - 垂类公司在音视频传输稳定性上优于大厂泛用型云服务,例如声网通过自建全球网络优化传输效率 [9] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,显示强劲市场需求 [9] - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为数字社会不可或缺的基础设施 [9] 公司财务与运营状况 - 声网母公司Agora, Inc. 在2025年一季度和二季度分别收入3327万美元和3425.9万美元,同比增长0.8%和0.1% [12] - 公司增长由海外市场Agora贡献,其2025年第二季度收入为1820万美元,同比增长16.7%,而声网中国收入为1.155亿元人民币(约1610万美元),同比下降12.4% [13] - 声网中国活跃客户数量增长停滞,截至3月末和6月末分别为1994和1997 [13] - 公司2025年第二季度研发费用为1400万美元,占总收入的40.9%,但同比去年同期的1810万美元下降23.0%,主要因优化全球员工队伍导致人员成本下降 [13] - 公司于2025年8月出现核心高管变动,董事、首席技术官和首席科学家钟声离职,其职责由CEO赵斌接管 [17]
年度服务时长首破万亿分钟,声网乘对话式AI东风
搜狐财经· 2025-11-03 21:17
公司战略与产品动态 - 公司年度服务分钟数首次突破1万亿分钟,并发布多款对话式AI新品 [1] - 公司将对话式AI作为长期战略投入,OpenAI推出实时交互API是重要风向标 [3] - 公司推出对话式AI引擎2.0,能分辨讲话时机和讲话人,支持更多ASR和TTS供应商,并允许用户自定义语种和音色 [4] - 公司发布对话式AI Studio编排平台和开发套件,旨在帮助客户和开发者快速集成对话式AI能力 [4] - 2025年第二季度公司营收3430万美元,同比增长0.5%,净利润150万美元,实现同比扭亏 [5] 行业趋势与市场机遇 - 多模态大语言模型使计算机具备类人实时语音对话能力,67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [1] - 对话式AI的典型技术框架包括声音代理、自动语音识别、大语言模型处理和文本转语音等环节,每个环节都存在技术升级空间 [3] - AI语音助手、AI社交和陪伴、AI潮玩是当前对话式AI应用排名前三的热门场景 [4] - 人类对话中超过90%的信息感知依赖于语调、表情等非语言要素,实现真正的“类人对话”需攻克低延迟、自然打断、情感理解等挑战 [5] - 对话式AI被视为下一代AI基础设施的重要组成部分,以AI陪伴为例,其市场规模预测将从3000万美元增长至700亿-1500亿美元 [5] - 公司对话式AI相关用量在2025年第三季度实现151%的环比增长 [5]
实时互动产业迈入“万亿分钟”时代 对话式AI催生千亿新蓝海
中国经济网· 2025-11-03 16:37
行业宏观趋势 - 实时互动行业年度服务分钟数首次突破1万亿分钟,标志着该技术已成为关键基础设施 [1] - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80% [1] - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入 [2] - 对话式AI与语音智能体创业公司呈现爆发式增长态势 [2] 技术发展现状与挑战 - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI” [1] - 实时互动在环境感知与交互自然度上存在明显缺陷,仅21%的用户对现有AI对话体验满意 [1] - 实现“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战 [1] - 多模态大语言模型的出现为计算机提供了类人的实时语音对话能力,为解决挑战带来新路径 [1] 市场需求与公司表现 - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,展现出强劲市场需求 [2] - 对话式AI正驱动实时互动从能够“正常对话”到“声情并茂”的关键跃迁,带来不可估量的新市场 [1] 公司战略与产品发布 - 声网发布《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供系统实践指南 [2] - 声网推出对话式AI引擎2.0,包含开发套件、模型评测平台和对话式AI Studio,加速应用创新 [2] - 公司将继续与开发者、企业及合作伙伴共同推动实时互动生态进化,迎接智能交互新时代 [2]
对话式AI开启RTE行业千亿级新蓝海 AI出海需完成“心智跃迁”
中国经营报· 2025-11-01 21:12
大会核心信息 - 第十一届实时互联网大会在北京开幕,主题为“AI有声”,发布了《2025对话式AI发展白皮书》[1] - 大会汇聚全球RTE和对话式AI专家、开发者、企业代表与生态伙伴,探讨深度融合的新场景、新架构与新机遇[1] - 声网年度服务分钟数首次突破1万亿分钟,标志着RTE技术已成为关键基础设施[1] 实时互动行业趋势 - 视频高清化比例在过去两年增长超过10倍,海外市场720p以上分辨率流量占比已超80%[1] - WebRTC全球搜索热度呈现爆发式增长,标志着实时互动行业正迎来新一轮创新热潮[1] - 产业面临从“连通”到“对话”的本质挑战,交互对象从“人与人”扩展到“人与AI”[1] 对话式AI发展现状与挑战 - 仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受”[3] - 人类对话中仅有7%的信息来自语言内容,超过90%的信息感知依赖于非语言要素[3] - 实现真正的“类人对话”需攻克低延迟响应、自然打断、上下文管理、情感理解与表达等复杂挑战[3] 对话式AI的市场需求与增长 - 67%的企业已将语音AI智能体置于战略核心位置,84%的企业计划在未来一年增加相关投入[4] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长[4] - ARK Invest预测AI陪伴赛道有机会从3000万美元上涨到700亿—1500亿美元[4] 对话式AI的关键应用场景 - 对话式AI将在情感陪伴、智能硬件、在线教育三大场景中率先实现规模化落地[4] - 全球范围内正掀起实时语音技术新浪潮,对话式AI与语音智能体创业公司呈现爆发式增长[4] - 在Y Combinator近期的孵化团队中,语音智能体公司占比显著提升[4] 声网的产品与生态布局 - 声网发布了《2025对话式AI发展白皮书》及《对话式AI好奇者手册》,为行业提供实践指南[5] - 声网推出了对话式AI引擎2.0、对话式AI开发套件、对话式AI模型评测平台和对话式AI Studio[5] - 公司旨在加速对话式AI在实时互动行业的应用创新,开启RTE+AI的新篇章[5] AI出海战略与市场机遇 - AI出海从“可选项”转变为“必选项”,企业需完成从“算法精度”到“心智广度”的认知跨越[8] - 信任是超越技术的新竞争壁垒,源自透明的数据治理、商业共赢以及文化共情[8] - Agent、AI硬件与底层基础设施正构成三大核心机遇,智能体AI尚处于爆发初期[8] AI出海的竞争策略与执行路径 - 未来将形成两极化的生态格局:巨头主导通用场景,深耕细分领域的AI原生企业能建立坚固护城河[8] - AI硬件企业需通过持续创新保持“6个月到1年”的技术代差,并发挥供应链整合和快速迭代优势[9] - 市场策略可多元化,包括做深本地化、做深行业,或采用“声西击东”的创新策略[9] 技术发展的核心观点 - 真正伟大的技术应当“融于无形”,成功源于对技术的深刻理解并基于此满足用户需求[5] - 企业需要构建能够有机协同人类与AI Agent的组织形态,个体需具备指挥“AI大军”的能力[6][7] - 技术的真正力量在于“无之以为用”,应重视数据安全、流程再造、组织文化等短板[7]
AI驱动下,通信云行业的全球化变革
艾瑞咨询· 2025-07-30 09:18
行业投资评级 - 全球互联网通信云市场规模2024年约68亿美元 预计未来2-3年将迎来新一轮增长 [3] - AI在云通信市场的渗透率约15% 中国5G+AI渗透率达5.6% [16] - 未来3-5年厂商将围绕"多模态大模型×场景化服务"构建竞争壁垒 [5] 核心观点 技术演进方向 - 开发者需求向安全合规(82%国家已建立数据隐私法规)、智能(生成式AI应用占比54%)、开放(跨平台兼容)三大方向收束 [4][6][31] - 量子加密(QKD)、区块链存证等新技术提升跨境数据传输安全性 [39][43][45] - 通信云与AI协同进化 从辅助工具向沉浸式人机交互进阶 短期聚焦低准确性/低实时性场景 [51][52] 市场竞争格局 - 中国市场IM PaaS TOP3市占率90% 融云在TOP1000 APP中份额达56% [64][65] - RTC PaaS市场集中度CR3约70% 头部厂商转向差异化服务竞争 [66][67] - 典型企业技术路线: - 融云:安全合规底座+50+大模型API开放 [70][80] - Sendbird:全渠道AI Agent客服平台 [75] - 声网:VAD技术实现650ms超低延迟硬件交互 [85] 分章节要点 AI时代基础设施 - 通信云从传输管道升级为AI交互中枢 需满足多模态(文本/音频/视频融合)、高可靠、低时延需求 [10][11] - 2024年增速放缓至4% 主因AI场景成熟度不足及宏观经济影响 [15] - 中国市场进入存量竞争 开发者需求聚焦通信稳定(56%厂商设备支持量)、数据价值挖掘、跨平台开发效率 [20][22] 技术演进 安全升级 - 欧美通过GDPR等立法强化数据本地化 中东/东南亚加速本地化法规建设 [31][32] - 政企办公场景需硬件加密+传输协议+权限管理全链路可控 [34][36] 智能升级 - 全球TOP50 GenAI应用中聊天/角色扮演类占36% 通信云厂商通过开放第三方模型接入满足需求 [46][48] - 技术落地路径:IM场景侧重上下文数据分析 RTC场景需平衡ASR/LLM/TTS时延 [49] 开放升级 - 产品开放体现为API接口标准化 生态开放包括Flutter/uni-app等跨平台框架支持 [54][56] - 社交/游戏/教育等场景存在支付集成、内容审核、AI模型自定义等复合需求 [55] 竞争格局 - 产业链上游依赖IT基础设施厂商 下游连接ISV/SI及终端用户 [60] - 融云案例: - 安全方案:量子加密通信+中东本地化部署(JACO直播) [71] - 开放架构:支持Dify/扣子等AI平台+MCP接口标准化 [88][89] 发展趋势 - 技术层面:轻量级模型推动端侧落地 业务数据融合催生AI Agent类应用 [93][94] - 商业层面: - 智能眼镜/玩具等穿戴设备市场CAGR超10% 成新增长点 [96] - 多模态交互需求推动通信云向"神经中枢"升级 [95]
声网母公司2025年Q1财报:总营收同比增长12.1%,连续两个季度GAAP盈利
IPO早知道· 2025-05-28 09:52
财务表现 - 2025年第一季度总营收3327万美元,同比增长12.1%,增速较上一季度的3.6%显著提升 [2] - 连续两个季度实现GAAP盈利,第一季度净利润41万美元,利润额稳步增长 [2] - 截至2025年3月31日,现金储备达3.88亿美元,为高潜力领域布局提供支持 [2] 对话式AI战略布局 - 3月发布对话式AI引擎产品,开发者兴趣强烈,应用场景覆盖AI陪伴玩具、口语陪练、智能助手等 [2] - 预计对话式AI技术将渗透更多场景,推动长期收入增长 [3] - 对话式AI引擎支持全球主流大模型厂商,开发门槛低,仅需2行代码、15分钟即可完成升级 [6] - 定价策略优惠,成本为0.098元/分钟 [6] 技术优势与产品创新 - 语音对话延迟中位数低至650ms,智能打断响应时间340ms,模拟真人对话节奏 [8] - "选择性注意力锁定"功能可屏蔽95%环境噪声,80%丢包率下仍能稳定对话 [9] - 对话式AI开发套件基于博通集成AI芯片BK7258,实现端侧音频处理与超低延时响应 [9] - 硬件设计图与软件开发工具箱全面开源,1小时跑通Demo,1天完成产品原型 [11] 应用场景与客户案例 - 活跃客户数量达1994个,同比增长5.2% [4] - 教育领域:精灵学伴、豆神AI教师实现低延时自然对话,提升学习体验 [15] - 智能硬件领域:珞博Robopoet、集贤科技AI玩具、LOOKTECH AI助手等优化交互实时性 [17] - 跨语言场景:莲偶「会译蛋」支持多语言同声传译,毫秒级响应 [17]