Workflow
Background Agent Infra
icon
搜索文档
OpenAI 语音 AI 硬件快来了,处理“代码之后”的 AI 助理 ARR 突破 2.5 亿美金
投资实习所· 2026-01-03 17:34
语音AI行业增长与代表性公司 - 近年来大量AI客服、AI笔记产品涌现,其底层技术很大程度上依赖语音AI,带动了语音AI基础设施产品的快速发展,且收入增长迅速[1] - AI笔记领域的Infra产品ARR已超过1000万美元[1],而更聚焦细分领域的AI视频语音产品Manus在8个月内ARR突破1亿美元,种子轮融资超过4000万美元[1] - 作为同时深耕基础设施和应用层的公司,ElevenLabs的ARR据称已接近4亿美元,EBITDA利润率达到60%,且41%的财富500强公司是其客户[1] ElevenLabs的业务模式与增长 - ElevenLabs增长迅猛,据其创始人称,公司在最近一天内新增了1400万美元的ARR[3] - 公司产品从语音扩展到代理及更广泛的音频解决方案,已从单一产品发展为多产品企业平台,其增长策略结合了自助式和销售主导的进入市场方式[3] - 公司坚持“两手抓”的核心战略,即同时从事基础研究和终端应用开发,以此作为与OpenAI等大型AI模型竞争的关键优势[3] - 在基础设施方面,公司从零开始构建自己的语音AI基础模型,并为了控制成本、提高实验速度而建立了自己的数据中心用于模型训练[3] - 在应用开发端,公司提供面向个人创作者的文本转语音、语音克隆和配音等工具,以及面向企业的对话式AI平台,为企业提供完整的AI代理解决方案,应用于客户服务、医疗、教育等场景[4] OpenAI在语音AI领域的战略布局 - OpenAI正在全力升级其语音AI能力,整合工程、产品与研究团队,以支撑一款预计在2026年推出的、以语音交互为主的个人AI设备,这标志着公司向“耳朵交互”新时代的战略转型[4] - 其语音AI模型的改进目标是显著提升语音自然度、对话流畅性和实时响应能力,解决现有系统在准确率、反应速度及处理用户中断能力上的短板,新模型预计在2026年第一季度发布[5] - 此次技术布局与其硬件战略紧密相关,该个人设备将主要依赖语音作为交互界面,形态可能包括无屏幕智能音箱、可穿戴设备或智能眼镜,旨在打造更直觉、全天候可用的AI助手[5] - 有爆料称,OpenAI正在研发的首款AI硬件产品内部代号为“Gumdrop”,其中一个明确的产品方向可能是一支具备音频功能的AI智能笔,可实现语音交互并将手写笔记实时转录、上传至ChatGPT平台处理[6] 其他AI产品趋势 - 一个与Background Agent Infra趋势相关的产品,其ARR已达到2.5亿美元,年增长率为50%[8] - 该产品与核心解决代码生成的AI Coding产品不同,其核心是解决企业软件交付中开发完成后最耗时、最复杂的环节,即用AI自动化后续流程[8]