Workflow
国君计算机|DeepSeek NSA架构引领AI效率革新
国泰君安·2025-02-21 10:03

报告行业投资评级 未提及 报告的核心观点 - DeepSeek发布NSA相关论文突破长文本处理瓶颈,推动AI大模型转向算法效率竞争,有望激发创新浪潮,加速AI在各行业渗透,带动产业链升级,从基础设施到应用层都将迎来新发展机遇 [1] 根据相关目录分别进行总结 NSA技术在长上下文处理的突破 - NSA通过原生稀疏注意力机制在长上下文处理实现突破,长上下文处理是大模型发展关键瓶颈之一,softmax架构中注意力计算占解码64k上下文总延迟的70%-80% [1] - NSA采用三条并行注意力分支,在通用基准测试中不逊于全注意力模型,同时实现长文本处理效率提升 [1] NSA技术对AI民主化进程的推动 - NSA技术通过端到端的稀疏训练显著降低预训练所需计算资源,减少A100 GPU在预训练过程中的使用时长,降低企业开发大模型的资金与技术门槛,使更多中小企业有机会参与AI底层开发 [1] - 算力门槛显著降低将推动AI技术从少数科技巨头向更广泛市场普及 [1] NSA技术催生新应用场景与商业模式创新 - NSA技术使模型能够直接处理整本书籍、代码仓库或千轮级别的客服对话,提升长序列处理能力,显著扩展AI在文档分析、代码生成等领域的应用边界 [2] - 在边缘计算等低延迟场景中,NSA的高效推理特性或催生出全新商业模式,给硬件厂商、解决方案商等带来新市场机遇 [2]