Workflow
DeepSeek开源新版R1,媲美OpenAI最高o3模型
Seek .Seek .(US:SKLTY) 快讯·2025-05-29 05:41

开源大模型性能比较 - DeepSeek开源了R1最新0528版本,未提供详细说明但已开放模型 [1] - 在Live CodeBench测试中,DeepSeek-R1-0528的Pass@1得分为73.1,接近OpenAI的o3高版本(75.8)[1] - DeepSeek-R1-0528在Easy-Pass@1测试中得分为98.7,略低于04-Mini高版本的99.1 [1] 模型性能排名 - 04-Mini高版本以80.2的Pass@1得分排名第一,03高版本以75.8排名第二 [1] - DeepSeek-R1-0528以73.1的Pass@1得分排名第四,高于Grok-3-Mini高版本(66.7)[1] - Qwen3-235B-A22B和Gemini-2.5-Flash-Preview分别以65.9和60.6的Pass@1得分排名第八和第十 [1]