小凹语音输入法
搜索文档
AI接管了输入法:昔日的隐私焦虑和新的商业筹码
21世纪经济报道· 2025-12-09 18:45
行业概览与市场动态 - 输入法是一个沉寂多年的老赛道,但在2023年下半年重新活跃,字节跳动、智谱等大模型公司纷纷入局[1] - 输入法是国民级的日常应用场景,2020年第三方输入法App的活跃用户规模已达8.82亿,渗透率高达89.5%[1] - 过去两年,无论是老玩家搜狗还是后来者微信,都在持续强化输入法的AI功能[1] 主要参与者与产品动态 - 字节跳动的豆包输入法于11月24日正式上架,主打实时语音输入和智能联想功能[3] - 豆包输入法接入语音识别大模型Seed-ASR,官方称其语音识别错误率下降约40%,并支持多种方言[3] - 豆包输入法在键盘输入上也接入了大模型,用于联想句和语境预测[3] - 豆包应用是国内市占率第一的原生AI应用,2024年9月月活用户达到1.72亿,超过DeepSeek的1.4亿月活[3] - 智谱在AutoGLM中推出了小凹语音输入法,支持语音实时转写、自动润色和风格转换,但没有独立版本[7] - 行业参与者主要分为三类:传统输入法厂商(如搜狗、讯飞、百度)、大模型原生玩家(如豆包、智谱)以及垂直创业公司(如闪电说、Wispr Flow)[7] 产品功能与技术发展 - AI输入法的核心功能包括实时语音输入和基于大模型的智能联想[3] - 语音输入的价值被重新锚定为大模型的操作层入口,被视为可能取代图形交互界面的语音交互界面[9] - 创业公司如Wispr Flow的目标是实现零编辑率指标,并致力于成为以语音为核心的操作系统[9] - 未来的发展方向是让输入法具备更强的全局记忆,能够连接不同应用中的信息,为超级智能体(Agent)提供上下文基础[9][10] 数据隐私与安全设计 - 输入法被认为是打破App壁垒、获取全局信息最自然的方式,其长期上下文记忆能力引发隐私担忧[1] - 豆包输入法提供两种模式:不收集任何数据的基础打字模式和需要联网收集数据的完整体验模式[4] - 完整体验模式会收集通讯录、文字输入、语音输入、剪切板内容、上屏文字信息、应用场景信息以及设备信息和使用记录[4] - 苹果iOS系统对第三方输入法的语音输入有严格限制,会强制触发跳转以提醒用户麦克风权限被调用[4] - 为改善体验,豆包输入法设计了“免跳转保持时间”,默认开启30分钟,最长可选择“一直保持”[6] - 豆包输入法承诺只在用户主动使用语音输入时收集数据[6] - 其他输入法的免跳转设计各异:微信没有此功能;讯飞默认关闭,开启后最多维持3小时;搜狐和百度默认保持时间为1分钟[6] - 一些创业公司如闪电说强调使用安全私密、完全离线的端侧大模型,但为提升准确度也提供了需要联网的“AI纠错”选项[7] 商业化与数据使用演变 - 输入法长期面临商业化难题,过去其价值被视为流量入口,为其他盈利业务输血[9] - 剪贴板和键盘输入内容曾是隐私泄露的高风险地带,数据可能被用于用户画像和广告变现[8] - 2021年6月,搜狗、讯飞、QQ等15款输入法因违规收集个人信息被要求下架整改[8] - 随着监管趋严,行业数据使用不断收紧,越来越多产品开始强调不再将数据用于个性化广告[8] - 豆包输入法、微信输入法和闪电说的《第三方信息共享清单》中未出现广告投放商[8] - 搜狐输入法仅接入了去身份化的广告工具SDK[8] - 讯飞输入法和百度输入法仍接入了多个广告联盟SDK[8] - 在大模型时代,输入法的角色正在转变,不再追求直接变现,而是为AI提供更多上下文记忆[1][10] 行业挑战与未来展望 - 数据保护是输入法面临的最大挑战,需要解决如何说服用户接受以及满足合规要求的问题[10] - 纯离线的端侧处理方案面临产品内存大、计算量大和识别准确率有限等现实困难[10] - 如何从海量信息中提取真正有效的记忆和上下文,是技术上面临的发展问题[10] - 目前输入法普遍未提供明确的AI训练授权开关,但设有“体验改进计划”,在去标识化后使用数据优化产品[10]