DeepSeek OCR2
搜索文档
未知机构:CT电子继续看好国产算力国产模型进入密集发布期临近-20260204
未知机构· 2026-02-04 10:00
涉及的行业或公司 * **行业**:国产算力(AI算力)、人工智能大模型、云计算基础设施[1][2] * **公司**:DeepSeek、Kimi、阿里巴巴、百度、字节跳动、华为、曙光、沐曦、昆仑芯、芯原股份[1][2][3] 核心观点和论据 * **核心观点一:国产AI大模型进入密集发布期,将加速驱动模型商用进度**[1] * **论据**:近期多家公司发布或计划发布重量级模型,包括DeepSeek开源OCR2、Kimi发布并开源K2.5、阿里Qwen3-Max-Thinking、百度文心5.0[1] * **论据**:字节计划在2月推出豆包2.0、Seedream5.0、SeedDance 2.0三款新AI模型[1] * **论据**:阿里同样计划在春节期间发布新一代旗舰AI模型Qwen 3.5[1] * **核心观点二:国内云厂商AI资本开支持续保持高位,奠定国产算力需求基础**[2] * **论据**:根据金融时报报道,字节已初步规划2026年资本开支1600亿元,高于2025年约1500亿元[2] * **论据**:阿里在2025年云栖大会表示,正在积极推进3年3800亿元的AI基础设施建设计划[2] * **核心观点三:模型迭代加速将驱动推理侧算力需求快速增长,2026年是国产超节点上量元年**[2] * **论据**:国产模型快速迭代抢占用户AI交互入口,交互方式被重塑,对应推理侧算力需求有望加速提升[2] * **论据**:已有大量国产厂商发布新一代超节点方案,例如华为Atlas 950/960(搭载8192/15488张算力卡)、曙光scale x 640、沐曦、昆仑芯、阿里磐久等均有布局[2] * **核心观点四:供需两侧双向奔赴,产业链即将迎来放量时点,重点推荐芯原股份**[3] * **论据**:财通电子团队自12月以来持续重点推荐芯原股份,并将其列为国产算力首推中的首推[3] 其他重要内容 * 纪要来源为“CT电子”与“财通电子团队”,观点具有明确的卖方研究机构背景[1][3] * 文档内容存在部分重复,强调了“继续看好国产算力”的核心立场[1]
未知机构:国盛计算机DeepSeekOCR2模拟人类阅读习惯重排阅读顺序实现O-20260128
未知机构· 2026-01-28 10:00
【国盛计算机】DeepSeek OCR2 :模拟人类阅读习惯重排阅读顺序,实现OCR效果提升 # 传统OCR的痛点是什么? De 【国盛计算机】DeepSeek OCR2 :模拟人类阅读习惯重排阅读顺序,实现OCR效果提升 # 传统OCR的痛点是什么? 现实文档大多存在图文混排,AI容易读错顺序,导致OCR给出的结果较为混乱。 # DeepSeek-OCR2做了什么? 将"阅读顺序/阅读逻辑"的处理,从解码器(LLM)前置到了编码器(Encoder)中。 现实文档大多存在图文混排,AI容易读错顺序,导致OCR给出的结果较为混乱。 # DeepSeek-OCR2做了什么? 将"阅读顺序/阅读逻辑"的处理,从解码器(LLM)前置到了编码器(Encoder)中。 Deepseek创新性提出VisualCausalFlow(视觉因果流),先依据语义将文档重排为符合阅读逻辑的顺序,让编码器 先将 2D 文档内容"按语义重排为 1D 因果流",再交给 LLM 生成,从而让视觉编码器学会了一种更接近"人类阅读 习惯"的机制。 # 效果如何? OmniDocBench v1.5测试综合得分 91.09,相比上一代deepse ...