VisualCausalFlow（视觉因果流） - 财报，业绩电话会，研报，新闻 - Reportify

VisualCausalFlow（视觉因果流）

搜索文档

未知机构：国盛计算机DeepSeekOCR2模拟人类阅读习惯重排阅读顺序实现O-20260128

未知机构· 2026-01-28 10:00

纪要涉及的行业或公司 * 行业：计算机行业，具体为人工智能（AI）与光学字符识别（OCR）技术领域[1][2] * 公司：深度求索（DeepSeek）公司，专注于AI模型开发[1][2] 纪要提到的核心观点和论据 * **传统OCR技术痛点**：现实文档大多存在图文混排，AI容易读错顺序，导致OCR给出的结果较为混乱[1][2] * **DeepSeek-OCR2的技术创新**：将“阅读顺序/阅读逻辑”的处理，从解码器前置到了编码器中[1][2] 创新性提出VisualCausalFlow（视觉因果流），先依据语义将文档重排为符合阅读逻辑的顺序，让编码器先将2D文档内容“按语义重排为1D因果流”，再交给LLM生成[2] 这种机制让视觉编码器学会了一种更接近“人类阅读习惯”的机制[2] * **技术效果**：在OmniDocBench v1.5测试中综合得分91.09，相比上一代DeepSeek OCR有显著提升[2] * **技术启发与潜在影响**：DeepSeek-OCR2将二维理解拆解为两个层级的“一维因果推理”：Encoder负责构建阅读流，Decoder负责生成与推理[2] 未来的影响可能不仅限于OCR，而有可能扩大至一切多模态领域任务，都有望从这种“先学会读顺序”的思路中获益[2] 其他重要但是可能被忽略的内容 * 无其他内容

VisualCausalFlow（视觉因果流）

多模态领域任务

Artificial Intelligence

VisualCausalFlow（视觉因果流）

多模态领域任务

Artificial Intelligence