后摩智能发布全新端边大模型AI芯片，CEO吴强：要让AI算力像电一样方便好用

产品发布 - 公司正式发布端边大模型AI芯片后摩漫界®M50，同步推出力擎™系列M2卡、力谋®系列加速卡及计算盒子等硬件组合，形成覆盖移动终端与边缘场景的完整产品矩阵 [2] - M50芯片实现160TOPS@INT8、100TFLOPS@bFP16物理算力，搭配最大48GB内存与1536GB/s带宽，典型功耗仅10W，支持15B到70B参数本地大模型运行 [2] - 产品矩阵包括：力擎™LQ50 M2卡支持7B/8B模型推理超25tokens/s，力擎™LQ50 Duo M2卡集成双M50芯片达320TOPS算力，力谋®LM5050/LM5070加速卡分别集成2颗/4颗M50芯片最高达640TOPS，BX50计算盒子支持32路视频分析与本地大模型运行 [4] 技术突破 - M50采用第二代SRAM-CIM双端口存算架构，支持权重加载和矩阵计算同时进行，实现多精度混合运算 [3] - 自主研发第二代IPU架构天璇通过压缩自适应计算周期实现弹性计算，最高提供160%加速效果 [3] - 内建高速多芯互联技术实现算力与带宽扩展，适配后摩大道®编译器自动选择最优算子，支持浮点运算无需量化调优 [4] - 相比传统架构能效提升5～10倍，完美适配端边设备"算得快又吃得少"需求 [4] 应用场景 - 产品可广泛应用于消费终端、智能办公、智能工业等领域，支持全流程本地离线处理 [5] - 消费终端赋能笔记本、平板等设备本地大模型推理，实现智能交互与内容生成 [5] - 智能办公场景支持断网环境下多语种翻译、纪要生成 [5] - 智能工业领域实现产线质检与车路云协同实时分析决策，生产数据设备端闭环处理 [5] 战略布局 - 公司已启动下一代DRAM-PIM技术研发，目标突破1TB/s片内带宽，能效较现有水平再提升三倍 [5] - 技术路线旨在推动百亿参数大模型在终端设备普及，使AI算力融入PC、平板等日常设备 [5] - 近两年获得中国移动产业链发展基金、北京市人工智能基金等多家机构投资支持 [6] 行业影响 - 公司通过存算一体技术与大模型深度融合，构建"低功耗、高安全、好体验"的端边智能新生态 [5] - 技术路径实现"离线可用、数据留痕不外露"，解决云端传输隐患 [5] - 目标让大模型算力像电力一样随处可得，走进产线、设备和用户指尖 [8]