力擎LQ50 Duo M.2卡

搜索文档
对话后摩智能CEO吴强:未来90%的数据处理可能会在端边
观察者网· 2025-07-30 14:41
公司动态 - 后摩智能在WAIC 2025首次展示M50系列芯片,包括M50芯片、力谋®BX50计算盒子、力擎LQ50 Duo M2卡等核心产品 [1] - M50芯片专为大模型推理设计,面向AI PC和智能终端场景,实现160TOPS INT8、100TFLOPS bFP16物理算力,搭配48GB内存和1536GB/s带宽,典型功耗仅10W [4] - 公司已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽,能效提升三倍,推动百亿参数大模型在终端设备普及 [9] 产品技术 - M50芯片支持1.5B到70B参数的本地大模型运行,具有"高算力、低功耗、即插即用"特点 [4] - 力擎LQ50 Duo M2卡采用标准M2规格,为AI PC和陪伴机器人提供即插即用的端侧AI能力 [4] - 公司通过存算一体技术实现AI大模型"离线可用、数据留痕不外露"的特性 [4] - 2024年初公司推出优化版M30芯片,针对大模型进行调整 [7] 市场战略 - 公司定位端边AI计算市场,CEO认为未来90%数据处理将在端和边完成 [1] - 意向客户包括联想的AI PC、讯飞听见的智能语音设备、中国移动的5G+AI边缘计算设备 [8] - 重点布局消费终端、智能办公、智能工业三大领域,包括平板电脑、智能语音系统、运营商边缘计算等场景 [8] - 将机器人视为新兴垂直赛道,类比十年前的智能驾驶市场 [8] 行业趋势 - 大模型发展呈现从训练向推理迁移、从云端向边端迁移两大趋势 [1] - 端边AI具有实时响应、低成本、数据隐私和用户体验优势,预计将成为未来趋势 [7] - 5G+AI边缘计算被视为重要发展方向 [8] - 公司CEO提出"让大模型算力像电力一样随处可得"的愿景 [5]
最高能效比!他又死磕“存算一体”2年,拿出全新端边大模型AI芯片
量子位· 2025-07-28 14:42
核心观点 - 后摩智能发布业界能效比最高的存算一体端边大模型AI芯片后摩漫界®M50,采用第二代存算一体技术,实现160TOPS@INT8算力、100TFLOPS@bFP16浮点算力、153.6GB/s带宽及48GB内存,典型功耗仅10W [3][4][7][9] - 公司通过全栈自研(存算IP、IPU架构、编译器工具链)实现软硬件深度协同优化,解决传统冯·诺依曼架构的"功耗墙"和"存储墙"瓶颈 [11][12][18][24][26] - 存算一体技术成为差异化竞争关键,完美契合大模型时代对算力密集和带宽密集的需求,推动端边智能生态发展 [37][38][40][41] 技术突破 - **第二代SRAM-CIM技术**:彻底改造SRAM阵列结构实现真正存内计算,支持双端口加载与计算并行 [12][14][15] - **天璇IPU架构**:实现比特级弹性加速(最高160%加速效果)及直接浮点运算(FP16模型无需量化) [20][21][22] - **后摩大道®编译器**:支持算子自动拆分优化,降低开发门槛 [24] - **量产方案**:自主开发MBIST/CBIST测试技术解决存算芯片量产难题 [17] 产品矩阵 - **终端侧**:力擎LQ50 M.2卡(单卡7B/8B模型推理>25 tokens/s)及LQ50 Duo(双M50芯片320TOPS)支持被动散热 [29][31][32] - **边缘侧**:力谋®LM5050/LM5070加速卡(最高640TOPS)及BX50计算盒(支持32路视频分析+本地大模型) [33][35][36] 行业战略 - 差异化路径选择存算一体技术,避开与英伟达等巨头的直接竞争 [37][38][39] - 聚焦端边大模型AI计算,预计未来90%数据处理在端边完成 [41] - 已获中国移动、北京人工智能基金等产业资本支持 [41] - 下一代DRAM-PIM技术研发中,目标1TB/s带宽与3倍能效提升 [46][47]