Workflow
DeepSeek悄悄上线新模型
21世纪经济报道·2025-10-30 18:42

核心观点 - DeepSeek发布全新多模态模型DeepSeek-OCR,其核心技术“上下文光学压缩”通过将文本作为图像处理,实现7-20倍的token压缩,理论上可实现无限上下文,并可能为光计算芯片进入大语言模型领域铺平道路 [1][3][4][5] 技术创新与原理 - 模型提出“上下文光学压缩”技术,将文本作为图像处理以实现高效信息压缩,例如一页文本通常需要2000-5000个文本tokens,转换为图像后仅需200-400个视觉tokens,实现7-20倍压缩 [3] - 在10倍压缩时保持97%解码精度,20倍压缩时仍有60%精度,该技术模拟人脑遗忘机制,通过将历史上下文渲染成图像并随时间降采样,模拟“近期信息高保真、远期信息自然褪去”的生物遗忘曲线 [3][4] - 技术能大幅降低数据分割和组装操作次数,从而降低整体计算负荷,降低对后端计算硬件在规模和精度上的直接压力 [4] 对光计算产业的潜在影响 - DeepSeek-OCR技术解决了光计算引入大模型的最大问题——序列上下文过长,其视觉编码器部分非常适合由光学协处理器执行,而文本解码部分仍由电子芯片处理,记忆压缩可完全交给光计算芯片实现最优分工 [5] - 光计算芯片利用光速传输、高并行性和低功耗特性,被誉为“后摩尔时代”潜力技术,该模型为光计算高并行性和低功耗优势发挥提供了明确技术路径 [1][5] - 光计算芯片目前处于产业化早期,主要需解决先进光电融合封装和软件生态成熟度问题,业内预计距离在数据中心与GPU同台竞技还需3-5年时间攻克工程、成本和生态难题 [6][7] 产业参与者和进展 - 国内主要光计算参与者包括曦智科技、图灵量子、光本位等公司,国外有Lightmatter、Lumai、Cerebras Systems等厂家 [6] - 图灵量子已围绕薄膜铌酸锂开展全流程研究并实现规模化量产,具备从设计、版图、流片、测试到封装的完整能力 [7]