服务异常事件分析 - 公司旗下服务在3月29日至31日连续三天发生服务异常,涉及网页对话、App及API,故障分别持续约1小时48分、10小时13分和1小时3分,其中3月30日的10小时13分中断是公司成立以来最长的一次服务中断 [1][5] - 服务中断事件在3月31日17时引发舆论关注,相关话题再次冲上热搜,目前所有服务已恢复稳定运行 [1] - 多名国产模型供应商人士推断,此次仅面向C端的产品服务中断可能与模型迭代过程中的灰度测试有关 [6] 模型迭代与V4发布相关推测 - 自2026年2月以来,公司多次错过预期发布窗口,其下一代模型DeepSeek V4仍未正式发布 [5] - 行业推测,3月初公司网页端在代码能力与上下文处理方面的增强更新,可能是DeepSeek V4在进行隐身测试 [6] - 有供应商分析认为,公司可能在4月正式发布V4前,提前面向C端用户群测试其新增的“原生推理层”在高并发请求下的稳定性 [6] - 在3月30日服务中断问题解决后,官方API文档中仍未列出任何关于V4模型的ID [7] - 有模型供应商分析,公司在冲击更高性能架构、扩张至百万Tokens级别推理能力的过程中,暴露了基础设施建设的短板,新旧架构在底层存储聚合层出现了冲突 [7] DeepSeek-OCR 2技术突破 - 公司于2026年1月27日发布DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,使AI能基于图像含义动态重排图像片段,模仿人类追随场景逻辑流的方式处理图像,改变了传统AI从左到右刚性扫描的方式 [8][9] - 该模型在OmniDocBench v1.5基准测试中取得91.09%的成绩,相较于前代DeepSeek-OCR提升了3.73% [8] - 模型在保持高精度的同时严格控制计算成本,其视觉Token数量限制在256至1120之间,与Google的Gemini-3 Pro保持一致,在实际生产环境中处理在线用户日志和PDF预训练数据时的重复率分别下降了2.08%和0.81% [8] 技术架构与行业意义 - DeepEncoder V2的核心是引入可学习的“因果流查询”,使编码器具备因果推理能力,构建了“两个级联的1D因果推理结构”,有效弥补了2D图像结构与1D语言建模之间的鸿沟 [9][10] - 此次发布具有深远的架构探索意义,初步验证了使用语言模型架构作为视觉编码器的潜力,为迈向统一的全模态编码器提供了可能路径 [10] - 公司认为,“两个级联的1D因果推理器”模式通过将2D理解分解为“阅读逻辑推理”和“视觉任务推理”两个互补子任务,可能代表了实现真正2D推理的一种突破性架构方法 [10]
突发!DeepSeek又“崩”了!
证券时报·2026-03-31 20:45