Workflow
DeepSeek V3到V3.1,走向国产算力自由
英伟达英伟达(US:NVDA) 虎嗅APP·2025-08-24 17:02

以下文章来源于未尽研究 ,作者未尽研究 未尽研究 . AI,新能源,合成生物,地缘X 本文来自微信公众号: 未尽研究 (ID:Weijin_Research) ,作者:未尽研究,题图来自:AI生成 从V3到V3.1,DeepSeek正在探索出一条"算力自由"之路。 从魔改PTX到使用UE8M0 FP8 Scale的参数精度,DeepSeek先榨取英伟达GPU算力,再适配国产芯 片,可能会在软硬件协同方面带来新的突破, 进一步提高训练效率,最多可以减少75%的内存使用 ,从而在实际应用中减少对进口先进GPU芯片的依赖。 DeepSeek正在与下一代国产GPU芯片厂商一起,向算力自主又迈进一步。正是这样一种令人激动的 前景,激活了科技色彩愈发浓厚的中国资本市场。 DeepSeek发布了V3.1,而不是广受期待的V4或者R2,连R1也消失了。 DeepSeek变成了一个混合推 理架构,即一个模型同时支持思考模式和非思考模式。 这是一个趋势,在V3.1发布一周之前,GPT- 5发布了,这是一个"统一的系统",包括一个对话模型,一个思考模型,和一个实时路由,用来决定 如何结合对话与思考。 这次升级提高了DeepSeek ...