Memory Optimization
搜索文档
DeepSeek新模型MODEL1曝光
金融界· 2026-01-21 07:59
模型发布与架构更新 - DeepSeek在发布一周年之际 其下一代旗舰模型“MODEL1”的相关信息通过代码更新曝光 [1] - 公司在GitHub上更新了FlashMLA代码 横跨114个文件中 有28处提到了“MODEL1” [1] - “MODEL1”在代码中与已知的“V32”(即DeepSeek-V3.2)作为不同的模型出现 表明其很可能是一种新的架构 [1] 技术细节与优化 - 新模型“MODEL1”在代码中与V32的具体技术差异体现在KV缓存布局、稀疏性处理和FP8解码方面 [1] - 新模型在内存优化上进行了多处改进 与现有V32模型存在不同 [1] 发布计划与市场预期 - 此前有市场消息称 DeepSeek计划在2月中旬春节前后发布其下一代旗舰模型 [1]