DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
模型性能升级 - 模型基于2024年12月发布的DeepSeek V3 Base基座,但在后训练中投入了更多算力,显著提升了思维深度与推理能力[1] - 在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,整体表现已接近其他国际顶尖模型如o3与Gemini-2.5-Pro[1] - 针对幻觉问题进行了优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率比旧版降低了45~50%左右[2] 功能与应用优化 - 在创意写作方面,针对议论文、小说、散文等文体进行优化,能够输出篇幅更长、结构内容更完整的长篇作品,写作风格更贴近人类偏好[2] - 支持工具调用(不支持在thinking中进行工具调用),当前模型Tau-Bench测评成绩为airline 53.5% / retail 63.9%,与OpenAI o1-high相当[2] 发布与部署信息 - DeepSeek-R1-0528于5月29日凌晨在Hugging Face平台正式开源[2] - 用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变[2]