Workflow
不只是“小升级”!DeepSeek-R1新版获海外盛赞,每经记者亲测挑战三大编程任务
SKLTYSeek .(SKLTY) 每日经济新闻·2025-05-29 18:46

每经记者|宋欣悦 每经编辑|兰素英 5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可 通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。 在此次更新中,模型代码能力的提升最为显著。知名代码测试平台LiveCodeBench显示,更新后的R1性能可以媲美OpenAI o3模型的高版本。 除代码能力外,R1新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。 《每日经济新闻》记者(以下简称"每经记者")通过俄罗斯方块游戏开发、太阳系模拟与交互展示,以及设计英伟达最新财报网页这三项任务对R1新版本 进行了实测,发现DeepSeek-R1-0528的编程能力确实强大,对物理世界的理解以及文本的提取都相当准确。 知名AI评论人Haider在社交媒体上评价称,这是开源的一大胜利。 瑞士IT咨询公司CTOL Digital Solutions首席执行官Max Zhang则表示,在这一"小"进步之后 ...