力擎™ LQ50 M.2卡

搜索文档
死磕存算一体,后摩智能发布重磅新品
半导体芯闻· 2025-07-29 18:29
冯诺依曼架构瓶颈与存算一体技术 - 冯诺依曼架构芯片面临高算力、高带宽和低功耗难以同时实现的矛盾[1] - 存算一体技术通过集成计算和存储单元,从根本上解决数据传输慢、功耗高的问题[1] - 存算一体技术特别适合AI和大模型应用,因其需要算力密集和带宽密集的特点[6] 存算一体技术商业化挑战 - 学术界研究停留在理论层面,量产和软件适配是主要商业化障碍[5][6] - 后摩智能选择存算一体路线基于两个原因:解决功耗/存储墙问题,以及避开与英伟达直接竞争[6] - 公司深耕该技术四年多,2023年起重点研究与大模型的结合[6][7] 后摩漫界M50芯片技术特点 - 采用第二代SRAM-CIM双端口存算架构,支持权重加载与矩阵计算并行[8] - 集成第二代IPU架构"天璇",最高可提供160%加速效果[8] - 物理算力达160TOPS@INT8、100TFLOPS@bFP16,典型功耗仅10W[10] - 支持最大48GB内存和153.6GB/s带宽,能效比传统架构提升5-10倍[10] - 配备新一代编译器"后摩大道",支持自动算子优化和原生浮点运算[11][12] 产品矩阵与应用场景 - 力擎LQ50 M.2卡支持7B/8B模型推理超25tokens/s[14] - 力擎LQ50 Duo M.2卡集成双M50芯片,算力达320TOPS[14] - 力谋加速卡最高集成4颗M50芯片,算力达640TOPS[14] - BX50计算盒子支持32路视频分析与本地大模型运行[14] - 应用场景包括消费终端、智能办公、智能工业等离线本地处理需求[16] 公司战略与技术路线图 - 目标成为端边大模型AI芯片领跑者[18] - 已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽[18] - 新技术预计能使能效较现有水平再提升三倍[18] - 愿景是让大模型走出云端,进入终端设备赋能各行各业[18]