Workflow
非结构化数据结构化
icon
搜索文档
半年 ARR 增 10 倍达数千万美金,非结构化数据结构化的需求正在爆发
投资实习所· 2025-12-26 13:49
文章核心观点 - 生成式AI,特别是多模态模型,正在彻底改变企业处理非结构化数据的方式,使其从难以利用的“数字工件”转变为可对话、可分析、可自动化的“数字内存”,这代表了企业信息处理方式的根本性转变 [1][2][5] - 企业内非结构化数据(如文档、合同、音视频)占比高达90%,而传统可处理的结构化数据仅占10%,AI解锁非结构化数据的价值将成为企业最宝贵的资源之一 [2][6] - 这一趋势正在催生巨大的市场机会,涌现出专注于企业级非结构化数据处理和自动化的成功创业公司,并在财务上表现出惊人的增长 [10][11][14] 行业趋势与市场洞察 - AI最大的价值点在于对非结构化数据的处理,这是海外B端创业者的深刻共识 [1] - 企业信息中,非结构化数据占据了约90%,而结构化数据仅占10%左右 [2] - 生成式AI首次实现了与非结构化数据的对话,并能以无限的规模和速度执行人类任务,完全改变了游戏规则 [5] - 会议语音是尚未被充分利用的数据金矿,是知识工作者实践的黑洞 [9] - 企业CEO和高管正在寻找安全、可靠、贴合公司业务背景的ChatGPT企业版本 [10] 代表性公司及产品分析 - **Box**:其创始人指出,AI正在引发企业信息处理方法上前所未有的巨大转变 [2] - **Otter**:作为AI笔记转录产品,其已成为首个年度经常性收入超过1亿美元的产品,证明了处理非结构化语音数据的市场价值 [9][14] - **Glean**:其年度经常性收入已突破2亿美元,核心是将类似ChatGPT的能力安全地融入企业环境,解决AI不了解企业内部业务背景的挑战 [10][14] - **NotebookLM**:有观点认为,此类产品的出现可能使所有结构化的CRM公司失去未来 [7] - **a16z投资的金融领域产品及通用Infra产品**:一家专注于金融非结构化数据处理,另一家通用基础设施产品在约半年内从0增长至超过100万美元年度经常性收入,随后半年多时间年度经常性收入又呈10倍级增长,超过1000万美元 [11]