Workflow
对话式AI引擎
icon
搜索文档
声网母公司2025年Q1财报:总营收同比增长12.1%,连续两个季度GAAP盈利
IPO早知道· 2025-05-28 09:52
财务表现 - 2025年第一季度总营收3327万美元,同比增长12.1%,增速较上一季度的3.6%显著提升 [2] - 连续两个季度实现GAAP盈利,第一季度净利润41万美元,利润额稳步增长 [2] - 截至2025年3月31日,现金储备达3.88亿美元,为高潜力领域布局提供支持 [2] 对话式AI战略布局 - 3月发布对话式AI引擎产品,开发者兴趣强烈,应用场景覆盖AI陪伴玩具、口语陪练、智能助手等 [2] - 预计对话式AI技术将渗透更多场景,推动长期收入增长 [3] - 对话式AI引擎支持全球主流大模型厂商,开发门槛低,仅需2行代码、15分钟即可完成升级 [6] - 定价策略优惠,成本为0.098元/分钟 [6] 技术优势与产品创新 - 语音对话延迟中位数低至650ms,智能打断响应时间340ms,模拟真人对话节奏 [8] - "选择性注意力锁定"功能可屏蔽95%环境噪声,80%丢包率下仍能稳定对话 [9] - 对话式AI开发套件基于博通集成AI芯片BK7258,实现端侧音频处理与超低延时响应 [9] - 硬件设计图与软件开发工具箱全面开源,1小时跑通Demo,1天完成产品原型 [11] 应用场景与客户案例 - 活跃客户数量达1994个,同比增长5.2% [4] - 教育领域:精灵学伴、豆神AI教师实现低延时自然对话,提升学习体验 [15] - 智能硬件领域:珞博Robopoet、集贤科技AI玩具、LOOKTECH AI助手等优化交互实时性 [17] - 跨语言场景:莲偶「会译蛋」支持多语言同声传译,毫秒级响应 [17]
声网发布对话式AI引擎:让任意大模型开口说话
36氪· 2025-03-07 17:37
产品发布 - 公司于3月6日举办"AI开口,互动无界"发布会,推出全球首个对话式AI引擎,支持任意文本大模型升级为多模态大模型 [2] - 定价策略为0.098元/分钟,单次赠送1000分钟,智能打断功能增值服务0.042元/分钟 [2][7] 核心技术能力 - 模型选择多:支持DeepSeek、ChatGPT等全球主流大模型及语音合成供应商,兼容30000+终端机型 [4] - 响应速度快:全链路优化后语音对话延迟中位数650ms,打断响应低至340ms [5] - 抗干扰能力强:选择性注意力锁定功能屏蔽95%环境噪声,80%丢包率下仍可稳定对话 [5] - 开发效率高:仅需2行代码15分钟完成部署,支持LLM与TTS的URL/Key快速接入 [6] 成本效益分析 - 用户单次对话平均3轮问答21.1秒,成本约3分钱,月均15次对话成本不足5毛钱,年成本5元 [8] 应用场景拓展 - 主要落地场景包括智能助手、虚拟陪伴、口语陪练、智能客服及智能硬件 [10] - 智能硬件领域可实现语音控制、智能看护、个性化服务,覆盖AI玩具、教育硬件、穿戴设备等 [10]
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话
量子位· 2025-03-07 15:12
核心观点 - 声网推出超低延迟实时对话式AI引擎,支持DeepSeek等大模型接入,仅需两行代码即可实现高质量语音交互[2][3] - 该引擎每分钟成本仅0.098元,单次对话平均成本3分钱,月成本不足5毛钱,年成本5元,价格极具竞争力[3][5] - 技术突破包括响应延迟中位数650毫秒,打断响应低至340ms,支持嘈杂环境和弱网条件下的稳定交互[7][8][9][10] - 开发者可在15分钟内完成AI语音交互功能部署,支持全球主流大模型和语音合成供应商的灵活切换[11][13][14] - 声网定位为"AI语音交互中间件",开创"语音交互即服务"新模式,推动生成式AI行业变革[17][19][22] 技术性能 - 关键延迟指标:对话响应延迟中位数650毫秒,远低于1.7秒的体验阈值[7][8] - 打断功能:支持自然打断,响应时间低至340ms,模拟人类对话节奏[9] - 抗干扰能力:可屏蔽95%环境噪声,在嘈杂场所保持对话质量[9] - 弱网适应:80%丢包率下仍可稳定交流,断网3-5秒不影响流畅度[10] - 全球覆盖:依托200+数据中心的SD-RTN网络实现跨区域低延迟[10] 成本优势 - 按用量付费模式:每分钟0.098元,单次赠送1000分钟[3] - 单次对话成本:平均3轮问答/21.1秒,成本3分钱[5] - 月成本:15次对话场景下不足5毛钱,年成本5元[5] - 无使用上限:支持百万级用户规模的多模态AI应用[5] 开发者体验 - 极简接入:2行核心代码即可完成大模型对接[2][11] - 快速部署:15分钟实现从零到完整AI Agent部署[11] - 模型兼容:支持全球主流大模型厂商,与OpenAI协议兼容[13] - 音色定制:可接入语音合成供应商的自定义音色[14] - 硬件适配:音视频SDK支持30000+终端机型,覆盖中低端设备[16] 行业影响 - 模式创新:开创"语音交互即服务"新业态,实现RTC与大模型技术解耦[17][18] - 生态定位:通过统一API接口成为"AI语音交互中间件"[19] - 基础设施:为多模态实时交互的Agent应用提供关键技术支撑[21] - 行业推动:加速"让所有AI都能开口说话"的生成式AI变革[22]
声网母公司2024Q4及全年财报:实现季度GAAP盈利,发布对话式AI引擎
IPO早知道· 2025-02-25 10:39
财务表现 - 2024年Q4总营收3445万美元,同比增长3.6%(不含已终止的低毛利业务)[4] - 2025年Q1收入指引3100-3300万美元,同比增速4.4-11.1%,较2024年Q4增速加快[4] - 2024年Q4 GAAP净利润16万美元,同比扭亏为盈[4] - 实现GAAP盈利难度高于Non-GAAP,彰显公司内生增长动力与运营根基[7] 对话式AI引擎产品 - 发布对话式AI引擎Beta版,支持开发者15分钟部署基于大模型的AI Agent[5] - 产品优势:自然流畅对话体验(智能停顿/打断处理)、先进语音处理(注意力锁定/降噪)、超低延迟(650ms响应)[10] - 技术指标:屏蔽95%背景噪声,误打断率较ChatGPT降低50%[12] - 全模型适配能力,支持30000+终端机型,80%丢包下仍可稳定交流[12] 客户与市场数据 - 截至2024年底活跃客户1979个,同比增长8%[5] - 全球注册应用数超93.1万,同比增长25%[5] - 对话式AI应用场景:智能助手/虚拟陪伴/口语陪练/智能客服/智能硬件[14] 行业合作与落地 - 与博通集成合作推出AIDK解决方案,在CES 2025展示智能眼镜/陪伴机器人等原型机[16] - AI x IoT解决方案已实现在低功耗芯片上接入大模型,保证低延时互动[16] 战略方向 - 生成式AI被视为未来增长核心驱动力,将加速行业渗透[8] - 2025年聚焦运营效率提升与可持续盈利增长[4]