思维链压缩 - 财报，业绩电话会，研报，新闻 - Reportify

思维链压缩

搜索文档

DeepSeek 更新，一句话让国产芯片集体暴涨

36氪· 2025-08-25 07:36

公司技术更新 - DeepSeek V3 1版本采用混合推理架构Hybrid Reasoning Architecture 支持思考模式和非思考模式自由切换[6] - 新架构集成通用对话复杂推理专业编程等核心功能于单一模型打破此前V3与R1模型分离的壁垒[9] - 推理效率大幅提升思考模式下任务表现与前代顶级R1-0528持平但输出token数量减少20%至50% 非思考模式输出长度更短且性能不打折[9] - 实现思维链压缩训练阶段生成更简洁高效的推理路径在保证答案准确性的同时降低计算成本[10] - 采用UE8M0 FP8参数精度结合MXFP8块缩放技术减少信息损失并节省资源[13][15] - UE8M0 FP8格式动态范围大可同时表示极大和极小数避免数据溢出或归零[15] - 新参数精度与国产新一代芯片原生兼容包括摩尔线程MUSA 3 1 GPU和芯原VIP9000 NPU[16] 行业影响 - 国产AI进入软硬协同阶段减少对英伟达 AMD等国外算力依赖[2] - 打破性能越高成本越贵的行业魔咒为金融医疗等高算力场景应用提供经济方案[2][10] - 社区测试显示DeepSeek V3 1在Aider多语言编程测试中分数超过Claude 4 Opus且成本更低[10] - 国产芯片概念股应声大涨每日互动尾盘拉升收盘大涨13 62%[2] - 推动国产AI芯片技术升级此前大部分国产AI加速器仅支持FP16 INT8方案[16] 用户反馈与应用 - 开发者社区反响热烈 Hugging Face平台热度显著上升[12] - 用户生成内容多样化包括符合物理定律的小球动态模拟振动编码VJ制作个性化自画像等[17][18][19] - 部分用户反馈翻译和写作功能需现场编写SYSTEM PROMPT指令存在中英夹杂和错词问题[21] 产品定位与市场表现 - DeepSeek以低调方式发布V3 1版本未进行大规模宣传[4] - 品牌成为国产AI精神图腾市场对下一代R2版本期待度高[23]

Seek .(US:SKLTY)

思维链压缩

思维链压缩