Seek .-DeepSeek AI新模型曝光：搭载 MODEL1 全新架构，最快2月上线

公司动态与产品发布 - DeepSeek计划于2025年2月中旬农历新年期间推出新一代旗舰AI模型DeepSeek V4 [1] - 新模型将搭载全新技术架构，其写代码能力有望实现显著提升 [1] - 在DeepSeek-R1模型发布一周年之际，开发者在GitHub平台发现DeepSeek更新了114个FlashMLA相关代码文件，其中28处明确提及未知的"MODEL1"大模型标识符 [1] - 代码分析显示，"MODEL1"标识符与现有模型"V32"（即DeepSeek-V3.2）被并列或区分引用，技术人士推测其大概率对应一款采用全新架构的AI模型 [1] 技术架构与创新 - 新架构在键值（KV）缓存布局、稀疏性处理方式以及FP8数据格式解码支持等关键技术环节进行了优化调整 [3] - 这些技术革新针对性解决了模型运行中的内存占用与计算效率问题 [3] - DeepSeek研究团队此前已连续发布两篇技术论文，分别提出"优化残差连接（mHC）"的创新训练方法，以及受生物学启发研发的"AI记忆模块（Engram）" [3] - 业内普遍推测，即将发布的DeepSeek V4有望整合这些最新研究成果，以进一步释放AI模型在复杂任务处理中的潜力 [3]