DeepSeek-R1今天一次「小更新」,颠覆了大模型格局,网友:尽快放R2
机器之心·2025-05-29 11:04
机器之心报道 昨晚,DeepSeek 官方宣布其 R1 推理模型升级到了最新版本(0528),并在今天凌晨公开了模型及权重。 编辑:泽南、Panda 超出所有人的期待。 千呼万唤始出来,DeepSeek 迎来了推理模型更新。 HuggingFace 链接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528 模型文件上传时间是凌晨 1 点,不知 DeepSeek 工程师们是不是加班到了最后一刻。也有网友表示,这回又在端午节假期前发新模型,简直比放假通知还靠谱。 这次更新的升级版 R1 参数量高达 6850 亿,体量巨大,虽然开源了出来,但大多数人只能围观。如果「满血版」不进行蒸馏,是肯定无法在消费级硬件上本地运 行的。 不过这种不说话直接放链接的态度还是引来了网友们的普遍欢迎。 根据 DeepSeek 的小范围通知,更新后的 R1 版本采用 MIT 许可证,这意味着它可以用于商业用途,从版本号看来这是一个「小」升级,不过人们大量实测后发 现,新版大模型的性能提升颇为明显。 我们也能在新版 DeepSeek-R1 模型的配置文件中看到更多但并不出人意料的信息,包 ...