Workflow
DeepSeek-R1 再进化,这次的更新好强啊...
SKLTYSeek .(SKLTY) 36氪·2025-06-04 11:32

又被 DeepSeek 偷袭了! 业内苦等的 R2 模型迟迟未到,结果 DeepSeek 却悄然出手: DeepSeek R1 摇身一变,成了 DeepSeek-R1-0528! 依然是开源、依然赶在节前,这次的更新不改大版本号,只低调地加上日期,延续了 DeepSeek 一贯的命名套路,就像两个月前的DeepSeek-V3-0324。 别看名字没变,这波 R1 版本的升级可不简单,特别是在"复杂推理""前端开发""幻觉降低"等方向,带来了实打实的进化。 这次的 DeepSeek-R1-0528 还是沿用了 2024 年 12 月发布的 DeepSeek V3 Base 模型,只不过这次后台"砸"了更多算力,让它能像人一样多想一步、再多想 一步。 打个比方,用"tokens"来衡量它的"思考量": 同样是做 AIME 2025 测试,旧版 R1 平均每题只要 12K tokens 就交卷,新版 R1-0528 则要跑到 23K tokens 才满意。 不过到底值不值,还得看你怎么用: 毕竟一个问题花上半小时,即便结果再完美,也难免等得心痒痒。 但相应地,思考更深了,编程和推理能力也就跟上来了。 也就是说,De ...