或颠覆文档处理模式,DeepSeek OCR模型再更新
Seek .Seek .(US:SKLTY) 选股宝·2026-01-28 07:16

核心观点 - DeepSeek发布全新DeepSeek-OCR2模型,其创新的动态重排图像部分技术有望颠覆传统文档处理模式,开启原生多模态推理新路径 [1] 技术突破与性能 - 新模型采用DeepEncoderV2方法,使AI能根据图像含义动态重排图像部分,而非机械地从左到右扫描 [1] - 在基准测试中,新模型性能达到91.09%,较前代提升3.73% [1] - 模型视觉token使用上限降至1120个,前代为1156个 [1] - 该技术代表新一代“压缩存储”思路,通过将文本映射为视觉表征进行高倍率压缩,以少量视觉token承载长上下文信息,实现从“扩大计算基数”到“减少计算负荷”的转变 [2] - 在低于10倍压缩率下可实现约97%的文本还原精度,能满足多数信息检索与文档归档需求 [2] - 在20倍高压缩率下精度约为60%,适用于容错性较高的线索检索场景 [2] 优势与应用潜力 - 采用OCR技术可显著降低计算与显存资源消耗,提升长文本处理效率 [1] - 对表格、图表等结构化信息具备天然处理优势 [1] - 在20个A100节点上具备日处理3300万页数据的吞吐能力 [2] - 对小语种(如阿拉伯语、僧伽罗语)有良好支持,在全球化商业部署中具有显著优势 [2] - “视觉即压缩”的范式可能重塑未来大语言模型的输入方式 [2] - 为统一全模态编码器提供了可行方向 [1] 相关上市公司业务 - 金现代:公司与百度在大模型应用的开发、OCR识别能力的算子互补等方面有合作 [3] - 汉王科技:公司为客户提供了文字识别OCR平台等产品与服务 [3]

Seek .-或颠覆文档处理模式,DeepSeek OCR模型再更新 - Reportify