Workflow
混合推理架构
icon
搜索文档
「AI新世代」R2没等来先发V3.1!DeepSeek深陷大模型“包围圈”热度炙烤
华夏时报· 2025-08-22 14:49
DeepSeek V3.1版本更新 - 公司于8月21日发布V3.1版本而非市场期待的R2版本[2] - 新版本采用混合推理架构同时支持思考模式和非思考模式实现R1和V3的合体[4] - 相比5月版本V3.1响应速度更快且具备更强Agent能力API上下文扩展至128K[5] 用户反馈与模型调整 - 部分用户对新版本不满在评论区呼吁恢复R1版本并催促推出多模态模型[2][6] - 公司已将官方网页端App小程序及API开放平台调用模型全部更新为DeepSeek-V3[3] - R1版本转换标识已从网页端和手机端移除[3] 定价策略变更 - API接口调用价格自9月6日起调整为输入0.5元/百万tokens缓存命中4元/百万tokens缓存未命中输出12元/百万tokens[5] - 新定价为V3和R1标准价格的中和版V3原价为输入0.5/2元输出8元R1原价为输入1/4元输出16元[5] - 取消每日00:30至08:30夜间时段优惠此前该时段V3价格降50%R1价格降75%[5] 行业竞争态势 - 智谱于8月20日推出全球首个手机Agent采用GLM-4.5和GLM-4.5V模型具备多模态能力[7] - 月之暗面7月11日发布KimiK2模型阶跃星辰7月25日推出Step-3多模态推理模型阿里发布通义千问3推理模型百川智能8月11日开源医疗增强模型Baichuan-M2[8] - 国外厂商同步推进OpenAI推出GPT-5Anthropic发布Claude Opus 4.1谷歌发布Genie 3交互世界模型xAI宣布开源Grok 2模型[8][9] 公司市场表现 - 公司网站访问量连续4个月下降平均每月降低9.63%6月访问量为3.8亿[10] - App月活用户6月出现首次下滑7月继续下降11.87%至8293万[10] - 同期字节豆包月活达1.32亿腾讯元宝月活达4473万保持增长[10] 技术发展趋势 - 混合推理架构成为行业趋势阿里通义千问Qwen3和GPT-5均采用类似架构[4] - 该架构可平衡快速获取信息和深度分析需求提升工作效率并降低token消耗量[4] - 行业处于螺旋式上升状态企业间竞争激烈但尚无绝对领先者[9]
DeepSeek-V3.1发布:更高效思考、更强Agent能力、更长上下文
生物世界· 2025-08-21 16:00
1. 混合推理架构:思考模式 & 非思考模式自由切换 编辑丨王多鱼 排版丨水成文 刚刚 , DeepSeek 正式发布了 DeepSeek - V3.1 。这一升级版包含以下主要变化: DeepSeek-V3.1 首次引入 混合推理架构 ,用户可以在"深度思考"模式和 "非思考"模式之间自由切换: 思考模式 (DeepSeek-Reasoner) :适用于需要深度推理的任务,如数学计算、复杂逻辑分析等,推理效率更高。 非思考模式 (DeepSeek-Chat) :适用于日常对话、信息查询等轻量级任务,响应更迅速。 在官方 App 和网页端,用户可通过"深度思考"按钮,一键切换模式,体验更智能的交互方式! 2. 更强的 Agent 能力:编程、搜索大幅提升 DeepSeek-V3.1 通过 Post-Training 优化,大幅提升了工具使用和智能体任务的表现: 编程智能体 (SWE & Terminal Bench) :在代码修复 (SWE) 和命令行终端任务 (Terminal Bench) 中,表现优于前代模型,所需轮数更少,效率更高! 混合推理架构 :一个模型同时支持思考模式与非思考模式; 更高的 思考 ...
DeepSeek-V3.1正式发布
第一财经· 2025-08-21 15:53
产品升级 - DeepSeek-V3 1正式发布 采用混合推理架构 同时支持思考模式与非思考模式 [3] - 相比DeepSeek-R1-0528 新模型思考效率提升 可在更短时间内给出答案 [3] - 通过Post-Training优化 新模型在工具使用与智能体任务中表现有较大提升 [3] 平台服务更新 - 官方App与网页端模型已同步升级为DeepSeek-V3 1 用户可通过深度思考按钮自由切换思考模式与非思考模式 [3] - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文扩展至128K [3] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义 [3] - 增加对Anthropic API格式支持 可轻松将DeepSeek-V3 1能力接入Claude Code框架 [4] 价格调整 - 北京时间2025年9月6日凌晨起 执行新版API接口调用价格表 取消夜间时段优惠 [4] - 9月6日前所有API服务仍按原价格政策计费 [6]
官宣!DeepSeek-V3.1 发布,API调用价格低至0.5元/百万Tokens
新浪科技· 2025-08-21 15:05
API价格调整 - 公司将于北京时间2025年9月6日00:00起调整DeepSeek开放平台API接口调用价格 [1] - 输入价格调整为缓存命中0.5元/百万tokens 缓存未命中4元/百万tokens [1] - 输出价格调整为12元/百万tokens [1] 技术升级 - 新版本DeepSeek-V3.1采用混合推理架构 支持思考模式与非思考模式自由切换 [3] - 相比DeepSeek-R1-0528版本 新模型思考效率显著提升 能在更短时间内给出答案 [3] - 通过Post-Training优化 模型在工具使用与智能体任务中的表现获得较大提升 [3] 产品部署 - 官方App与网页端模型已同步升级至DeepSeek-V3.1版本 [3] - 用户可通过"深度思考"按钮实现思考模式与非思考模式的自由切换 [3]
DeepSeek-V3.1发布
证券时报网· 2025-08-21 15:01
DeepSeek-V3 1升级 - 混合推理架构:一个模型同时支持思考模式与非思考模式 [1] - 更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3 1-Think能在更短时间内给出答案 [1] - 更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升 [1]