R1模型发布一周年 DeepSeek新模型“MODEL1”曝光
DeepSeek已发布的主要模型是两条技术路线的代表:追求极致综合性能的V系列"全能助手"和专注于复 杂推理的R系列"解题专家"。 2024年12月推出的V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能 基础。此后,DeepSeek在V3基础上快速迭代,发布了强化推理与Agent(智能体)能力的 V3.1,并于2025年12月推出了最新正式版V3.2。同时,还推出了一个专注于攻克高难度数学 和学术问题的特殊版本V3.2-Speciale。 2025年1月发布的R1,则通过强化学习,在解决数学问题、代码编程等复杂推理任务上表现 卓越,并首创了"深度思考"模式。 科技媒体The Information月初爆料称,DeepSeek将在今年2月中旬农历新年期间推出新一代旗舰AI模型 ——DeepSeek V4,将具备更强的写代码能力。 此前,DeepSeek研究团队陆续发布了两篇技术论文,分别介绍了名为"优化残差连接(mHC)"的新训 练方法,以及一种受生物学启发的"AI记忆模块(Engram)"。这一举动不禁引起用户猜测,DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。 ...