后摩大道®

搜索文档
最高能效比!他又死磕“存算一体”2年,拿出全新端边大模型AI芯片
量子位· 2025-07-28 14:42
核心观点 - 后摩智能发布业界能效比最高的存算一体端边大模型AI芯片后摩漫界®M50,采用第二代存算一体技术,实现160TOPS@INT8算力、100TFLOPS@bFP16浮点算力、153.6GB/s带宽及48GB内存,典型功耗仅10W [3][4][7][9] - 公司通过全栈自研(存算IP、IPU架构、编译器工具链)实现软硬件深度协同优化,解决传统冯·诺依曼架构的"功耗墙"和"存储墙"瓶颈 [11][12][18][24][26] - 存算一体技术成为差异化竞争关键,完美契合大模型时代对算力密集和带宽密集的需求,推动端边智能生态发展 [37][38][40][41] 技术突破 - **第二代SRAM-CIM技术**:彻底改造SRAM阵列结构实现真正存内计算,支持双端口加载与计算并行 [12][14][15] - **天璇IPU架构**:实现比特级弹性加速(最高160%加速效果)及直接浮点运算(FP16模型无需量化) [20][21][22] - **后摩大道®编译器**:支持算子自动拆分优化,降低开发门槛 [24] - **量产方案**:自主开发MBIST/CBIST测试技术解决存算芯片量产难题 [17] 产品矩阵 - **终端侧**:力擎LQ50 M.2卡(单卡7B/8B模型推理>25 tokens/s)及LQ50 Duo(双M50芯片320TOPS)支持被动散热 [29][31][32] - **边缘侧**:力谋®LM5050/LM5070加速卡(最高640TOPS)及BX50计算盒(支持32路视频分析+本地大模型) [33][35][36] 行业战略 - 差异化路径选择存算一体技术,避开与英伟达等巨头的直接竞争 [37][38][39] - 聚焦端边大模型AI计算,预计未来90%数据处理在端边完成 [41] - 已获中国移动、北京人工智能基金等产业资本支持 [41] - 下一代DRAM-PIM技术研发中,目标1TB/s带宽与3倍能效提升 [46][47]