AI语音输入行业兴起 - 2025年下半年起,AI语音输入法成为新风口,豆包输入法、智谱AI输入法等大厂产品相继推出或升级[6] - 搜狗输入法宣布其语音识别率达98%,日均语音使用次数近20亿次[6] - 海外市场同样活跃,Wispr Flow融资额达8100万美元,估值7亿美元,Typeless等产品在Product Hunt排行榜名列前茅[6] AI语音输入的技术优势 - 速度远超打字:普通打字速度约每分钟40-50字,而语音输入可达每分钟150-250字,比打字快约3-7倍[12][14][15] - 准确率更高:研究显示中文语音输入纠错率为6.67%,键盘输入则高达17.73%,当前产品准确率宣称达97%-98%[14][15] - 环境适应性增强:20分贝以下的低语(如树叶沙沙声)仍能保持97%的正确率,办公室等场景适用性提升[16][18] - 大模型赋能:新一代产品是“语音意图输入法”,能识别意图、删除语气词、修改语法、调整语气及翻译润色[15] 产品形态与用户体验变革 - 初创企业产品更激进,取消打字键盘,将语音键置于核心位置[15] - 支持语音修改错误,例如直接说出“把yán改成油盐酱醋的盐”即可修正[15] - 长段落输入准确率高于单字词,得益于大模型对上下文的理解[19] - 用户体验改变:作者用Typeless在53分钟内完成5500字初稿,节省2.5小时,实现“随地大小写”[7][34] 输入法作为潜在超级入口 - 输入法是穿透各App生态的基础入口,AI加持使其功能超越打字,可能实现跨应用调用[24] - 未来可能演变为系统级AI助手,突破输入框限制,成为类似理想中Siri的交互界面[24] - 苹果计划在2026年6月推出新版AI助手,整合至核心应用,支持轻声低语调用功能[26] 语音输入的历史必然性 - 语音是人类交流的初始方式,口语历史约10-20万年,文字仅约5500年,键盘输入历史约150年[28] - 中文打字历史短暂,五笔输入法于1983年发明,拼音输入法随互联网普及才降低门槛[30] - 研究预计到2028年,生成式AI将主要采用语音方式交互[32] - 语音输入属于直觉性的“系统1”思维,打字则属于需要学习的“系统2”思维,前者更自然高效[29]
AI语音输入法,人类进入「不打字」时代
36氪·2026-01-30 21:35