Workflow
AI语音从“输出”到“输入”,资本在用千万美元押注什么?
36氪·2025-07-30 11:09

行业融资动态 - 语音输入创企Willow Voice完成420万美元天使轮融资,由YC领投 [1] - 语音输入创企Wispr Flow完成3000万美元A轮融资 [1] - AI语音赛道头部公司ElevenLabs在1月完成2.5亿美元C轮融资,估值超30亿美元 [1] - 资本关注点从语音合成(输出)转向语音识别(输入)领域 [1] 技术产品定位 - Willow Voice和Wispr Flow专注ASR技术(自动语音识别),产品类似"语音输入法" [2] - 与传统语音转文字的区别在于增加"文字处理"步骤,追求"零编辑信息" [5] - 文字处理分三个层面:格式化文字输出、上下文理解、语境识别 [5] - Flow和Willow目前能做到第二层(上下文理解),第三层(语境识别)尚未实现 [5] 产品性能测试 - 非格式化文本场景下主流产品错词率低于10%,与人类水平相当 [4] - 格式化文本场景错词率平均增加10% [4] - 在To do List场景测试中,Flow和Willow能正确分段,Flow格式处理更优 [13] - 专业术语场景测试显示三款产品均存在错误,Flow表现略好但仍不理想 [16] - 邮件回复场景中Flow将"到时候"改为"届时",但整体仍偏口语化 [19] 用户数据与市场反馈 - Wispr Flow月环比用户增长超50%,6个月活跃用户留存率80% [20] - Wispr Flow付费率19%,年收入达380万美元(2024.7-2025.7) [20] - 非正式输入场景下用户满意度较高,Reddit和Product Hunt评价积极 [22] - 目标用户为硅谷VC/创业者/高管群体,后扩展至学生、开发者等专业人群 [9][11] 行业前景 - 语音输入通过减少人机交互摩擦实现提效,被验证为可行方案 [24] - 未来若实现用户完全信任,可能颠覆键盘成为新的人机交互范式 [24] - VC投资逻辑基于现实提效潜力+未来范式颠覆可能性 [24]