Workflow
OCR技术应用
icon
搜索文档
DeepSeek概念股短线拉升,OCR 2重磅发布,让AI学会“人类视觉逻辑”
金融界· 2026-01-27 14:18
市场反应 - DeepSeek发布新模型引发相关概念股短线拉升,云赛智联直线触及涨停,宏景科技20cm涨停,开普云、世纪恒通、并行科技短线拉升 [1] 技术突破与性能 - DeepSeek发布DeepSeek-OCR2模型,采用创新的DeepEncoder V2方法,使AI能根据图像含义动态重排图像部分,更接近人类视觉编码逻辑 [1] - 该技术打破传统OCR按固定顺序识别的局限,能更好理解图像语义关联,在复杂排版、扭曲变形、遮挡模糊等场景下识别准确率大幅提升 [6] - 在OmniDocBench v1.5基准测试中,该模型取得91.09%的成绩,较前代DeepSeek-OCR提升3.73% [6] - 模型在保持高精度的同时严格控制计算成本,其视觉Token数量限制在256至1120之间,上限与Google的Gemini-3 Pro保持一致 [6] - 在实际生产环境中,模型处理在线用户日志和PDF预训练数据时的重复率分别下降2.08%和0.81%,显示出极高的实用成熟度 [6] 架构意义与未来方向 - DeepSeek-OCR 2的发布具有深远的架构探索意义,DeepEncoder V2初步验证了使用语言模型架构作为视觉编码器的潜力 [7] - 这种架构天然继承了LLM社区在基础设施优化方面的成果,如混合专家架构和高效注意力机制 [7] - 这为迈向统一的全模态编码器提供了有希望的路径,未来单一编码器可能通过配置特定模态的可学习查询,在同一参数空间内实现对图像、音频和文本的特征提取与压缩 [7] - 模型展示的"两个级联的1D因果推理器"模式,通过将2D理解分解为"阅读逻辑推理"和"视觉任务推理"两个互补子任务,或许代表了实现真正2D推理的一种突破性架构方法 [7] 应用领域与行业机遇 - 模型可广泛应用于金融票据处理、医疗病历录入、政务文件数字化、古籍修复识别等多个领域,帮助相关企业降低人工识别成本,提升信息处理效率 [6] - OCR技术应用行业:为OCR行业带来技术升级方向,相关从事图文信息处理、数字化转型服务的企业可借助该模型优化自身产品,在金融、医疗、政务等领域拓展更多业务场景,迎来业绩增长机遇 [8] - 开源大模型服务行业:DeepSeek坚持开源开放的技术路线,持续推出高性能模型产品,为开发者和企业提供优质的模型底座,专注于大模型二次开发、模型部署与运维服务的企业将受益于行业热度提升,获得更多合作订单与市场关注 [8] - 端侧AI适配:众多企业完成DeepSeek模型在端侧设备上的适配部署,推动AI能力向边缘侧延伸,从事端侧硬件研发、边缘计算方案设计的企业将迎来发展机会,助力智能家居、智能车载、工业物联网等场景下的AI应用快速落地 [8]