Workflow
开源模型升级
icon
搜索文档
DeepSeek上新,又一次“开源的巨大胜利”
第一财经· 2025-05-29 12:52
DeepSeek-R1-0528模型升级 - DeepSeek-R1模型完成小版本试升级并于5月29日凌晨在HuggingFace开源平台发布 但官方未更新模型卡及公告介绍[1] - 海外开发者评价此次升级"并不小" 体现公司一贯低调风格[1] - 代码能力提升最为明显 在Live CodeBench测试平台性能接近OpenAI重量级o3-high模型[1] 模型性能测试数据 - 在LiveCodeBench平台454个问题测试中 DeepSeek-R1-0528以73.1%的Pass@1得分排名第四 仅次于04-Mini(High)的80.2% 03(High)的75.8%和04-Mini(Medium)的74.2%[4] - 在Easy-Pass@1测试中达到98.7% 接近排名第一的04-Mini(High)99.1%[4] - Medium-Pass测试得分85.2% 优于03(High)的84.4%但略低于04-Mini(Medium)的86.5%[4] 开发者实测反馈 - 在橙色小球撞击物体模拟测试中 新模型在平面橙色漫反射和撞击效果方面优于Claude-4-Sonnet[6] - 写作任务改进明显 输出更自然且格式规范 减少之前存在的"量子力学元素"问题[6] - 文本召回测试显示32K上下文内表现显著提升 但60K上下文效果下降明显[6] 行业对比与期待 - 开发者群体公认编程能力最强的Claude-4系列未出现在测试榜单中 可能受测试速率限制[6] - 海外网友对R2版本预期高涨 推测当前R1版本已展现强大潜力[7] - 开发者期待未来R2版本能大幅提升上下文长度和多模态能力 这两点对生产使用至关重要[7] 公司技术迭代特点 - 延续3月DeepSeek-V3-0324的迭代模式 在HuggingFace平台低调更新[7] - 新版V3模型借鉴R1强化学习技术 显著提升推理类任务表现 并优化前端开发和中文写作能力[7] - 业内猜测公司可能将架构不变的更新定义为小版本升级 与同业明显版本迭代形成差异化[7]