Workflow
DeepSeek-V3.2上线国家超算互联网 开发者可免费下载
Seek .Seek .(US:SKLTY) 搜狐财经·2025-09-30 19:58

IT时报记者 孙妍 9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了 DeepSeekSparseAttention(DSA,一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 DeepSeekSparseAttention首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 目前,超算互联网AI社区已汇聚700余款国内外优质开源模型,包括DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3等DeepSeek 系列,开发者可登录超算互联网AI社区,实现API调用、Chatbot在线推理对话、国产大模型分布式训练、微调等功能于一体的MaaS服务。 9月30日,依托国产深算智能加速卡以及全国一体化算力网,DeepSeek-V3.2-Exp上线国家超算互联网AI社区,企业和开发者均可在AI社区免费下载 DeepSeek-V3.2-E ...