大语言模型记忆遗忘机制
搜索文档
突破新领域 深度求索发布文字识别模型DeepSeek-OCR
新京报· 2025-10-21 11:11
公司动态 - DeepSeek于北京时间10月20日在开源社区Hugging Face上发布了新模型DeepSeek-OCR [1] - OCR模型是一种用来从图像中提取文本的技术 [1] - 公司还上传了与该模型相关的论文 [3] 技术性能 - 当文本标记数量在视觉标记数量的10倍以内时,模型可以达到97%的解码精度 [3] - 在20倍的压缩比下,OCR准确率仍能保持在约60%的水平 [3] 研究意义 - 该模型被描述为一项关于通过光学二维映射来压缩长上下文可行性的初步研究 [3] - 实验结果表明,该技术对于长上下文压缩、大语言模型中的记忆遗忘机制等研究领域展现了相当大的潜力 [3]