AI输入法
搜索文档
AI接管了输入法:昔日的隐私焦虑和新的商业筹码
21世纪经济报道· 2025-12-09 18:45
行业概览与市场动态 - 输入法是一个沉寂多年的老赛道,但在2023年下半年重新活跃,字节跳动、智谱等大模型公司纷纷入局[1] - 输入法是国民级的日常应用场景,2020年第三方输入法App的活跃用户规模已达8.82亿,渗透率高达89.5%[1] - 过去两年,无论是老玩家搜狗还是后来者微信,都在持续强化输入法的AI功能[1] 主要参与者与产品动态 - 字节跳动的豆包输入法于11月24日正式上架,主打实时语音输入和智能联想功能[3] - 豆包输入法接入语音识别大模型Seed-ASR,官方称其语音识别错误率下降约40%,并支持多种方言[3] - 豆包输入法在键盘输入上也接入了大模型,用于联想句和语境预测[3] - 豆包应用是国内市占率第一的原生AI应用,2024年9月月活用户达到1.72亿,超过DeepSeek的1.4亿月活[3] - 智谱在AutoGLM中推出了小凹语音输入法,支持语音实时转写、自动润色和风格转换,但没有独立版本[7] - 行业参与者主要分为三类:传统输入法厂商(如搜狗、讯飞、百度)、大模型原生玩家(如豆包、智谱)以及垂直创业公司(如闪电说、Wispr Flow)[7] 产品功能与技术发展 - AI输入法的核心功能包括实时语音输入和基于大模型的智能联想[3] - 语音输入的价值被重新锚定为大模型的操作层入口,被视为可能取代图形交互界面的语音交互界面[9] - 创业公司如Wispr Flow的目标是实现零编辑率指标,并致力于成为以语音为核心的操作系统[9] - 未来的发展方向是让输入法具备更强的全局记忆,能够连接不同应用中的信息,为超级智能体(Agent)提供上下文基础[9][10] 数据隐私与安全设计 - 输入法被认为是打破App壁垒、获取全局信息最自然的方式,其长期上下文记忆能力引发隐私担忧[1] - 豆包输入法提供两种模式:不收集任何数据的基础打字模式和需要联网收集数据的完整体验模式[4] - 完整体验模式会收集通讯录、文字输入、语音输入、剪切板内容、上屏文字信息、应用场景信息以及设备信息和使用记录[4] - 苹果iOS系统对第三方输入法的语音输入有严格限制,会强制触发跳转以提醒用户麦克风权限被调用[4] - 为改善体验,豆包输入法设计了“免跳转保持时间”,默认开启30分钟,最长可选择“一直保持”[6] - 豆包输入法承诺只在用户主动使用语音输入时收集数据[6] - 其他输入法的免跳转设计各异:微信没有此功能;讯飞默认关闭,开启后最多维持3小时;搜狐和百度默认保持时间为1分钟[6] - 一些创业公司如闪电说强调使用安全私密、完全离线的端侧大模型,但为提升准确度也提供了需要联网的“AI纠错”选项[7] 商业化与数据使用演变 - 输入法长期面临商业化难题,过去其价值被视为流量入口,为其他盈利业务输血[9] - 剪贴板和键盘输入内容曾是隐私泄露的高风险地带,数据可能被用于用户画像和广告变现[8] - 2021年6月,搜狗、讯飞、QQ等15款输入法因违规收集个人信息被要求下架整改[8] - 随着监管趋严,行业数据使用不断收紧,越来越多产品开始强调不再将数据用于个性化广告[8] - 豆包输入法、微信输入法和闪电说的《第三方信息共享清单》中未出现广告投放商[8] - 搜狐输入法仅接入了去身份化的广告工具SDK[8] - 讯飞输入法和百度输入法仍接入了多个广告联盟SDK[8] - 在大模型时代,输入法的角色正在转变,不再追求直接变现,而是为AI提供更多上下文记忆[1][10] 行业挑战与未来展望 - 数据保护是输入法面临的最大挑战,需要解决如何说服用户接受以及满足合规要求的问题[10] - 纯离线的端侧处理方案面临产品内存大、计算量大和识别准确率有限等现实困难[10] - 如何从海量信息中提取真正有效的记忆和上下文,是技术上面临的发展问题[10] - 目前输入法普遍未提供明确的AI训练授权开关,但设有“体验改进计划”,在去标识化后使用数据优化产品[10]
豆包输入法上线,用了两天我在微信聊天不想再打字
新浪财经· 2025-11-25 00:25
产品核心功能 - 语音输入功能是核心竞争力,在中文、英文和粤语识别准确度上表现突出,对语速快、同音字多的句子也能准确识别[2][3] - 支持粤语夹英文的混合输入模式,测试例句如“Sorry 啊,我地已经尽晒力啦”均能正确识别[4] - 具备语音输入数学公式的能力,对学生、教师和科研人员具有实用价值[5] - 采用Seed-ASR2.0模型技术,在中英文测试集上的错误率较之前的大型ASR模型降低10%-40%[6] - 支持下载约150MB的离线语音模型,可在信号弱的环境下使用语音输入功能[6] 产品基础性能 - 安装包体积为139MB,但功能尚不完整,被形容为“毛坯房”[1] - 基础词库丰富度达到主流输入法水平,能正确识别网络词汇如“确实型人格”和生僻字如“饕餮”[9] - 具备AI联想能力,输入“1+1=”或“西游记的作者是谁”可直接在候选栏显示结果[11] - 默认设置下打字响应速度不够快,但可通过调整设置为“极快”模式改善[13] - 键盘震动强度设置存在异常,“弱”档震感强而“强”档震感弱,可能是软件缺陷[13] 产品生态与兼容性 - 目前仅上线Android版本,iOS版显示即将上线,PC版仍处于开发阶段[11] - 暂不支持跨设备复制粘贴功能,对多设备用户使用体验造成影响[11] - 输入方式仅支持9键和26键,缺乏双拼、手写输入和繁体中文支持[15] - 表情包功能仅限于自带表情,无法实现表情包搜索和发送[15] - 键盘皮肤仅提供默认样式,设置页面缺乏深色模式选项[15] 技术特性与隐私保护 - 提供“基础输入”模式,关闭后可禁用语音转文字和翻译功能以保护隐私[7] - AI翻译功能存在局限性,如输入“LLM”会默认显示为“法学硕士”而非“大语言模型”[15]