Workflow
DeepSeek R1 迎来小更新大升级,性能直逼 OpenAI o3!
AI科技大本营·2025-05-29 16:05

DeepSeek R1-0528大模型更新 - 公司低调发布DeepSeek-R1-0528版本并开启公测,未提供详细技术说明[1] - 新版模型在Hugging Face平台开放访问[2] 性能改进 - 推理能力增强:思维链(Chain-of-Thought)表现更结构化,逻辑性提升[4] - 文本输出质量接近Google等领先模型水平,语言风格更成熟[5] - 代码生成优化:编程任务中输出更连贯,质量更高[6] 用户反馈 - Reddit用户实测显示模型可单次对话生成完整可玩游戏,但抽象推理能力有所下降[6] - 响应时间略有增加,用户认为是为准确性作出的合理权衡[7] - 在LiveCodeBench基准测试中表现接近o3(high)水平[8] - 成为首个能稳定正确回答"9.9-9.11"数学问题的模型[9] 技术参数与开源生态 - 模型训练规模达1亿tokens且持续增长,提供免费版本[11] - 采用MIT开源协议,允许商业用途,推动AI技术普及[11] 行业活动 - 2025全球产品经理大会将聚焦AI产品落地等议题[14]