行业投资评级 - 计算机行业投资评级为“推荐”(维持)[2] 核心观点 - DeepSeek团队开源视觉文本压缩模型DeepSeek-OCR,通过光学压缩技术实现多模态文档高效解析与跨语言处理,重塑大语言模型范式[2] - 该模型采用“上下文光学压缩”技术,将文本转化为图像实现高效信息压缩,在10倍压缩比下实现97%近无损解码精度[5] - 模型具备多语言兼容性和通用视觉理解能力,为大模型优化信息表达方式提供新思路,可能重塑未来大语言模型的输入方式[5] 技术架构与性能 - 模型架构分为视觉编码器DeepEncoder和轻量级解码器DeepSeek3B-MoE两部分[5] - DeepEncoder基于SAM+CLIP双结构设计,通过局部窗口注意力和双层16倍卷积压缩模块,1024×1024图像仅需256个token[5] - 解码器采用混合专家机制,推理时仅激活5.7亿参数,单A100 GPU日处理20万页数据[5] - 在OmniDocBench基准中以100视觉token超越竞品256token表现[5] 创新特性 - DeepEncoder支持多分辨率模式,从轻量Tiny到高保真Gundam,自适应不同复杂度任务[5] - 数据引擎覆盖3000万页多语言文档及图表、化学式等OCR 2.0数据,具备跨模态解析能力[5] - 训练流程采用两阶段策略,先独立训练DeepEncoder完成视觉压缩,再联合训练完整模型优化解压能力[5] - 在Fox基准的10倍压缩下精度达97%,20倍压缩仍保持60%[5] 应用价值 - 为LLM/VLM预训练提供高效数据生成方案,如金融报告中自动提取图表结构化信息[5] - 支持STEM领域专业化解析,如将化学式转化为SMILES格式[5] - 突破长上下文算力瓶颈,通过视觉token替代文本token减少计算开销[5] - 具备多语言兼容性,支持近百种语言,在20个A100节点上日处理3300万页数据[5] 投资建议 - 关注国产算力:阿里巴巴、寒武纪、海光信息、中科曙光、景嘉微、龙芯中科等[5] - 关注企业服务:办公、多模态、ERP、OA、编程、营销等细分领域相关公司[5] - 关注应用场景:金融、教育、法律、医疗、电商、安全、工业、军用等领域相关公司[5] 行业基本数据 - 计算机行业股票家数337只,占总市值0.04%[2] - 总市值59,939.50亿元,占市场5.06%;流通市值54,322.71亿元,占市场5.68%[2] - 绝对表现:1个月-5.9%,6个月27.2%,12个月31.4%[3] - 相对表现:1个月-7.7%,6个月5.4%,12个月15.0%[3]
DeepSeek-OCR发布,重塑大语言模式范式:计算机行业重大事项点评
华创证券·2025-10-23 17:05