DeepSeek小版本大升级,新R1模型代码能力媲美OpenAI o3
目前官方还未更新模型卡以及公告介绍,但不少开发者已经第一时间进行了测试,发现这个"小版本升级"并不小,海外开发者感慨"一如既往的DeepSeek低 调风格"。 5月28日晚,第一财经记者获悉,DeepSeek小助手在官方交流群中通知,DeepSeek R1模型已完成小版本试升级,紧接着就在29日凌晨,官方在开源平台 HuggingFace上发布了DeepSeek-R1-0528。 又一次"开源的巨大胜利"。 众多测试发现,DeepSeek-R1-0528目前提升最为明显的是代码能力,在代码测试平台Live CodeBench中,其性能几乎媲美OpenAI重量级的o3-high模型。 | | | | Rank 排名 | Model 模型 | Pass@1 ↓ | Easy-Pass@1 | Medium-Pass | | --- | --- | --- | --- | --- | | J | 04-Mini (High) | 80.2 | 99.1 | 89.4 0 | | 2 | 03 (High) 03 (高) | 75.8 | 99.1 | 84.4 | | 3 | 04-Mini (Medium) 04 ...