Workflow
生态破局
icon
搜索文档
DeepSeek 开源 TileLang 与 CUDA 算子:AI 底层国产替代的关键尝试
小熊跑的快· 2025-09-30 09:11
本次发布为实验版本,主要有两块内容一是DSA ( DeepSeek Sparse Attention),探索在长文本下的训 练及推理降本,成本又打骨折了,但这个其实之前其他厂商也有类似尝试,倒也不算意外 。 我个人觉得第二块内容开源 开源 TileLang 与 CUDA 算子版本, 意义反倒比较重大,重点聊聊 从国产替代的角度来看,DeepSeek 开源 TileLang 与 CUDA 算子版本的动作,本质上是在 AI 底层技术 栈(尤其是 GPU 算子开发领域)推动 "自主可控" 与 "生态破局" 的关键尝试,其意义可从技术自主 权、国产硬件适配、生态协同、创新效率四个维度深度解析: 一、打破 CUDA 生态垄断,争夺算子开发技术自主权 CUDA 作为 NVIDIA 主导的闭源异构计算平台,长期垄断全球 GPU 算子开发标准 —— 从底层指令集 到上层算子库(如 cuBLAS、cuDNN),几乎所有主流 AI 框架(PyTorch、TensorFlow)和大模型训练 推理都高度依赖其生态。这种垄断导致两个核心问题: 技术卡脖子风险:国内若长期依赖 CUDA 算子,在新模型研发中(如大模型 MoE 结构、多模 ...