Workflow
Mistral v0.3
icon
搜索文档
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
量子位· 2025-06-10 12:05
DeepSeek-R1性能表现 - 最新优化版R1-0528在编程榜单aider上取得60分 超过Claude 4 Sonnet的56.4分以及1月满血版R1 [1] - R1-0528满血版在aider得分71.4分 超过不开启思考的Claude 4 Opus [5] - aider榜单侧重现实软件工程任务评估 非单纯解题能力 [2] 量化技术突破 - 1.93bit量化版文件大小比8bit原始版降低70%以上 [3][9] - 最小1.66bit版本文件仅162GB 比8bit版缩减80% [9] - Unsloth工作室推出9种量化版本 涵盖1.66bit至5.5bit [7][8] - 推荐2.4bit和2.7bit版本 实现精度与体积最佳平衡 [14] 硬件适配性 - 1.78bit版本搭配64GB内存可实现每秒1token生成 [10] - 24GB显存显卡(如3090)配128GB内存可达每秒5token [11] - 建议180GB以上统一内存或显存+RAM组合以突破5token/秒 [12] Unsloth工作室技术能力 - 微调模型覆盖DeepSeek、Qwen、Phi、Mistral、Llama等主流模型 [16] - 优化后模型内存占用减少50%-80% 速度提升50%-2.2倍 [17] - GitHub仓库获4万星标 推出蒸馏版Qwen3-8B性能对标235B大模型 [16][19] 游戏场景表现 - R1-0528在Lmgame Bench六款游戏中表现突出 俄罗斯方块成绩超越o4-mini [22][25] - 糖果传奇得分548分 领先o4-mini约20分 [32] - 推箱子、2048等游戏表现较1月版本有显著提升 [28]