开源模型升级 - 财报，业绩电话会，研报，新闻

开源模型升级

搜索文档

第一财经· 2025-05-29 12:52

DeepSeek-R1-0528模型升级 - DeepSeek-R1模型完成小版本试升级并于5月29日凌晨在HuggingFace开源平台发布但官方未更新模型卡及公告介绍[1] - 海外开发者评价此次升级"并不小" 体现公司一贯低调风格[1] - 代码能力提升最为明显在Live CodeBench测试平台性能接近OpenAI重量级o3-high模型[1] 模型性能测试数据 - 在LiveCodeBench平台454个问题测试中 DeepSeek-R1-0528以73.1%的Pass@1得分排名第四仅次于04-Mini(High)的80.2% 03(High)的75.8%和04-Mini(Medium)的74.2%[4] - 在Easy-Pass@1测试中达到98.7% 接近排名第一的04-Mini(High)99.1%[4] - Medium-Pass测试得分85.2% 优于03(High)的84.4%但略低于04-Mini(Medium)的86.5%[4] 开发者实测反馈 - 在橙色小球撞击物体模拟测试中新模型在平面橙色漫反射和撞击效果方面优于Claude-4-Sonnet[6] - 写作任务改进明显输出更自然且格式规范减少之前存在的"量子力学元素"问题[6] - 文本召回测试显示32K上下文内表现显著提升但60K上下文效果下降明显[6] 行业对比与期待 - 开发者群体公认编程能力最强的Claude-4系列未出现在测试榜单中可能受测试速率限制[6] - 海外网友对R2版本预期高涨推测当前R1版本已展现强大潜力[7] - 开发者期待未来R2版本能大幅提升上下文长度和多模态能力这两点对生产使用至关重要[7] 公司技术迭代特点 - 延续3月DeepSeek-V3-0324的迭代模式在HuggingFace平台低调更新[7] - 新版V3模型借鉴R1强化学习技术显著提升推理类任务表现并优化前端开发和中文写作能力[7] - 业内猜测公司可能将架构不变的更新定义为小版本升级与同业明显版本迭代形成差异化[7]

开源模型升级

Artificial Intelligence

DeepSeek-R1-0528

DeepSeek-V3-0324

开源模型升级

Artificial Intelligence

DeepSeek-R1-0528

DeepSeek-V3-0324