Workflow
实测DeepSeek V3.1,不止拓展上下文长度
量子位·2025-08-20 15:48

DeepSeek V3 1与V3的差异分析 核心更新 - 上下文长度从65K扩展至128K 支持多种张量格式 [1][7] - 网页端界面将【深度思考(R1)】简化为【深度思考】 手机端仍在同步更新中 [2] - 当前Base版本可通过Hugging Face下载 完整版支持网页 APP和小程序访问 [6] 性能参数对比 - V3 1输入成本0 004元 千Token 输出成本0 016元 千Token Batch调用成本减半 [8] - V3输入成本0 002元 千Token 输出成本0 008元 千Token Batch调用成本同样减半 [8] - V3 1免费额度为各100万Token 有效期180天 V3未明确标注免费额度 [8] 功能测试表现 编程能力 - V3 1在Python代码生成中考虑更全面 提供依赖库安装 命令行使用说明及工作原理 [12][13] - 实测18 3MB GIF文件压缩 V3需二次压缩才能低于10MB V3 1方案更高效 [14][15] 情境写作 - V3输出风格理性平铺直叙 V3 1转为文艺诗意化表达 差异显著 [20] 数学理解 - 双曲线离心率计算题两者均正确 但V3 1推导过程更规范 [22][23][24] 翻译水平 - V3 1对长难句理解更优 但遗漏"several"等简单词翻译 V3偏好括号补充说明 [29] 冷门知识 - 构树果实分类问题两者均判断为核果 与小红书博主实验结论(瘦果)存在分歧 [30][37] 第三方评测与用户反馈 - 在aider测试中以71 6%得分超越Claude Opus 4 成本低68倍 [42] - SVGBench基准显示V3 1表现优于V3 1(思考模式)及R1 0528 [43][44] - 用户发现新增4个特殊token 关闭搜索时仍会自动触发搜索 [45] 物理模拟能力 - V3 1对"旋转六边形内弹跳球"的模拟效果优于V3 [47] 市场热度 - 发布后迅速成为Hugging Face热门话题第四 截至发稿升至第二 [40][41]