SRDA AI大模型专用计算架构 - 财报，业绩电话会，研报，新闻

SRDA AI大模型专用计算架构

搜索文档

重磅！中国团队发布SRDA新计算架构，从根源解决AI算力成本问题，DeepSeek“神预言”成真？

新浪财经· 2025-06-09 21:27

大模型算力成本挑战 - 大模型每生成1美元价值需支付3美元算力成本算力成本挑战已成为行业共识 [1] - 当前优化方案多集中于软件层面硬件源头解决方案较少现有新计算硬件如Groq多在大模型爆发前定型难以充分匹配需求 [1] SRDA架构创新 - 玉盘AI发布《SRDA AI大模型专用计算架构》白皮书提出系统级精简可重构数据流架构(SRDA) 从硬件源头解决AI算力核心瓶颈 [3] - SRDA架构将"数据流"作为核心设计哲学通过硬件直接映射AI计算图数据依赖关系实现计算单元间点到点直接传输减少内存依赖和访问次数 [8] - 架构采用3D堆叠DRAM内存技术实现计算单元内存私有化每个计算核心拥有专属内存区域消除共享总线竞争 [14] GPGPU架构局限性 - GPGPU架构为保证通用性未针对大模型需求优化类似"瑞士军刀切牛排" 工具缺乏针对性 [6] - H100每秒可计算1000万亿次但共享内存架构+低内存带宽仅能"喂饱"不足一半硬件算力 [7] - H100单卡功耗达700瓦超三分之一电量用于数据搬运而非计算 [7] 下一代AI芯片关键特征 - 需解决内存与互联带宽不足问题当前架构存在"几台车抢一个车位"现象 [7] - 需提升算力利用率避免类GPGPU架构通信开销及内存瓶颈导致理论算力打折 [7] - 需简化网络设计传统多层网络带来带宽层级差异协议转换开销和管理难题 [7] SRDA技术突破 - 采用I/O融合技术(QLink) 将节点内外网络融合为统一单层网络简化拓扑结构 [14] - 具备可重构特性允许根据AI模型调整数据流路径计算单元功能和内存模式适应未来模型变化 [16] - 基于开源RISC-V指令集提供简化指令降低算子开发难度 [16] 行业趋势与影响 - DeepSeek论文与玉盘SRDA架构在IO融合 3D堆叠DRAM等技术方向不谋而合显示行业共识正在形成 [6] - 当前算力瓶颈主要在于数据搬运及读写(I/O问题) 而非计算能力本身 [6] - SRDA架构可能颠覆GPGPU在AI场景的垄断地位形成"SRDA+3D-DRAM"替代"GPGPU+HBM"的新组合 [14]