Workflow
DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测
量子位·2025-07-03 12:26

大模型竞技场神秘模型steve的猜测与讨论 - 大模型竞技场秘密上线名为steve的神秘模型 在对话中透露来自DeepSeek [1] - 网友对steve身份展开热烈讨论 猜测可能是R2、V4或旧版本升级 [2][3] - 前端代码中发现steve存在痕迹 但公开页面无法直接找到该模型 [5] steve的性能表现与技术特征 - 通过对话测试确认steve自称来自DeepSeek 与mistral的厂商声明方式类似 [8] - 在智力测试中部分题目回答正确 但仍存在错误 [11] - 代码生成测试显示steve输出约300行 V3输出约800行 [13] - 部分网友认为steve表现不及V3和R1 思考时间较短 [19][22] DeepSeek-R2研发进展与行业动态 - 上周爆料称R2再度延期 因CEO对表现不满意且缺少英伟达H20芯片 [25][26] - 4月底流传R2参数:1.2T万亿参数 5.2PB训练数据 使用华为昇腾芯片 [32] - 公司最近更新是端午节前的DeepSeek-R1-0528 尚未发布R2 [34] - 行业同时关注奥特曼GPT5和马斯克Grok4进展 七月可能迎来多款大模型发布 [5] 历史版本与市场预期 - 去年12月发布V3模型 今年3月24日进行升级 [29] - 市场曾预期R2在4月上线 参照R1在初代V3后一个月发布的节奏 [31] - 行业认为"好事多磨"可能是更好选择 参考Llama4赶工翻车案例 [36]