Workflow
思维链压缩
icon
搜索文档
DeepSeek 更新,一句话让国产芯片集体暴涨
36氪· 2025-08-25 07:36
公司技术更新 - DeepSeek V3 1版本采用混合推理架构Hybrid Reasoning Architecture 支持思考模式和非思考模式自由切换[6] - 新架构集成通用对话 复杂推理 专业编程等核心功能于单一模型 打破此前V3与R1模型分离的壁垒[9] - 推理效率大幅提升 思考模式下任务表现与前代顶级R1-0528持平 但输出token数量减少20%至50% 非思考模式输出长度更短且性能不打折[9] - 实现思维链压缩 训练阶段生成更简洁高效的推理路径 在保证答案准确性的同时降低计算成本[10] - 采用UE8M0 FP8参数精度 结合MXFP8块缩放技术 减少信息损失并节省资源[13][15] - UE8M0 FP8格式动态范围大 可同时表示极大和极小数 避免数据溢出或归零[15] - 新参数精度与国产新一代芯片原生兼容 包括摩尔线程MUSA 3 1 GPU和芯原VIP9000 NPU[16] 行业影响 - 国产AI进入软硬协同阶段 减少对英伟达 AMD等国外算力依赖[2] - 打破性能越高成本越贵的行业魔咒 为金融 医疗等高算力场景应用提供经济方案[2][10] - 社区测试显示DeepSeek V3 1在Aider多语言编程测试中分数超过Claude 4 Opus且成本更低[10] - 国产芯片概念股应声大涨 每日互动尾盘拉升收盘大涨13 62%[2] - 推动国产AI芯片技术升级 此前大部分国产AI加速器仅支持FP16 INT8方案[16] 用户反馈与应用 - 开发者社区反响热烈 Hugging Face平台热度显著上升[12] - 用户生成内容多样化 包括符合物理定律的小球动态模拟 振动编码VJ制作 个性化自画像等[17][18][19] - 部分用户反馈翻译和写作功能需现场编写SYSTEM PROMPT指令 存在中英夹杂和错词问题[21] 产品定位与市场表现 - DeepSeek以低调方式发布V3 1版本 未进行大规模宣传[4] - 品牌成为国产AI精神图腾 市场对下一代R2版本期待度高[23]