DeepSeek上线论文,用OCR技术减少计算和存储开销
10月20日,DeepSeek上传了一篇名为《DeepSeek-OCR:Contexts Optical Compression》的论文。 论文提到,通过"把长文本内容渲染成一张图片,再让模型去"看"这张图,从而实现对文本信息的压 缩。"显著减少计算和存储开销。 文中介绍,在实验中,DeepSeek-OCR的表现优异。压缩比为10倍时,OCR精度可达97%;20倍压缩时 仍有60%精度。这些结果表明,模型在压缩文本的同时仍能保持相对高的准确性,尤其是在处理长文档 时,效果尤为突出。 *风险提示:股市有风险,入市需谨慎 另外,据YHResearch预计,2024年全球人工智能驱动的OCR市场规模约81.7亿元,到2031年市场规模将 接近136.9亿元。 相关公司中,合合信息:公司扫描全能王产品是业内标杆性产品,产品OCR识别率显著领先市场同类 产品。在复杂场景下(如多语言、多版式、多曲面等),公司的平均字符识别率为81.9%,领先于百度 的70.0%、腾讯的65.0%和阿里的66.9%。业务涵盖识别性能、AI核心能力、数据安全性和可靠性。 汉王科技:公司的OCR技术曾经获得国家科学技术进步二等奖,在手写体识别 ...