实时互动技术
搜索文档
教AI听懂人话,声网在AI淘金热中“卖铲子”
钛媒体APP· 2025-11-17 10:17
行业趋势与市场前景 - 对话式AI被企业高度重视,67%的企业在2025年已将其置于战略核心,84%的企业计划在未来一年增加相关投入 [1] - AI语音赛道获得密集融资,科技巨头如OpenAI和Google密集发布语音模型或产品 [1] - 对话式AI在情感陪伴、智能硬件、在线教育等场景规模化落地,相关硬件产品如陪伴玩具、智能眼镜、AI耳机成为消费热点 [2] - 根据热力榜单,AI语音助手、AI社交与陪伴、AI潮玩是对话式AI需求最强劲的前三大应用领域 [7] 技术挑战与用户痛点 - 当前AI硬件面临高退货率问题,AI毛绒玩具电商退货率达30%-40%,部分AI眼镜退货率高达40%-50% [2] - 用户体验不佳是主要问题,AI对话被指交互生硬、情感连接弱、同质化严重,体验像机器人“念稿” [2] - 用户满意度低,仅21%的用户对现有AI对话体验满意,部分服务的用户流失率高到“不可接受” [4] - 技术瓶颈包括低延迟响应、自然打断、上下文管理、情感理解与表达,人类对话延迟约400毫秒,而传统语音合成链路延迟可达2-3秒,超过500毫秒会显著损害用户体验 [5] - AI产品需具备防干扰能力,能区分用户指令与环境噪音,并在被打断后流畅回应 [6] 平台型技术公司的发展 - 提供底层语音交互技术的平台型公司在AI产业中角色日益重要 [1] - 实时通信服务商如即构科技、融云、科大讯飞、声网因提供稳定低延迟的实时传输技术而迅速增长 [7][9] - 垂类公司在音视频传输稳定性上优于大厂泛用型云服务,例如声网通过自建全球网络优化传输效率 [9] - 声网对话式AI相关用量在2025年第三季度实现151%的环比增长,显示强劲市场需求 [9] - 声网年度服务分钟数首次突破1万亿分钟,标志着实时互动技术已成为数字社会不可或缺的基础设施 [9] 公司财务与运营状况 - 声网母公司Agora, Inc. 在2025年一季度和二季度分别收入3327万美元和3425.9万美元,同比增长0.8%和0.1% [12] - 公司增长由海外市场Agora贡献,其2025年第二季度收入为1820万美元,同比增长16.7%,而声网中国收入为1.155亿元人民币(约1610万美元),同比下降12.4% [13] - 声网中国活跃客户数量增长停滞,截至3月末和6月末分别为1994和1997 [13] - 公司2025年第二季度研发费用为1400万美元,占总收入的40.9%,但同比去年同期的1810万美元下降23.0%,主要因优化全球员工队伍导致人员成本下降 [13] - 公司于2025年8月出现核心高管变动,董事、首席技术官和首席科学家钟声离职,其职责由CEO赵斌接管 [17]
WAIC现场最“聪明”展台!AI对话眼睛耳朵能力全打开
量子位· 2025-07-28 14:42
声网对话式AI引擎升级 - 核心观点:声网对话式AI引擎完成三大升级,实现多模态交互能力提升,包括选择性注意力锁定、视觉理解和数字人支持,显著提升AI交互体验[5][6][31] - 升级亮点:新增选择性注意力锁定功能,在嘈杂环境中可屏蔽95%干扰精准识别用户声音[11][12][13] - 技术突破:实现视觉理解能力,可实时看图识物并分析技术图表[18][21][22] - 集成能力:支持与商汤等主流数字人方案无缝集成,实现表情和肢体语言交互[24][25][28] 技术应用场景 - 教育领域:应用于豆神AI超拟人多对一直播课,实现AI教师低延时自然交互[38][39] - 智能硬件:赋能珞博智能"芙崽Fuzozo"情感陪伴产品,优化实时交互体验[41][43] - 家庭机器人:支持Enabot EBO Air 2 Plus实现精准语音识别和全球视频通话[44] - 行业覆盖:技术已应用于MiniMax Chat、星野、智谱清言、商汤商量等主流AI产品[45] 市场竞争优势 - 价格策略:接入成本低至每分钟0.098元,兼容OpenAI协议仅需两行代码[32][34] - 技术积累:依托多年RTE领域经验,具备音视频处理和低延迟传输核心技术[6][49] - 产品理念:以用户体验为核心,专注提升AI交互真实感和自然感[50][51] - 行业趋势:多模态AI交互成为明确发展方向,声网技术布局占据先发优势[48][52]