Workflow
后摩智能发布全新端边大模型AI芯片,CEO吴强:要让AI算力像电一样方便好用
IPO早知道·2025-07-26 20:58

产品发布 - 公司正式发布端边大模型AI芯片后摩漫界®M50,同步推出力擎™系列M2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵 [2] - M50芯片实现160TOPS@INT8、100TFLOPS@bFP16物理算力,搭配最大48GB内存与1536GB/s带宽,典型功耗仅10W,支持15B到70B参数本地大模型运行 [2] - 产品矩阵包括:力擎™LQ50 M2卡支持7B/8B模型推理超25tokens/s,力擎™LQ50 Duo M2卡集成双M50芯片达320TOPS算力,力谋®LM5050/LM5070加速卡分别集成2颗/4颗M50芯片最高达640TOPS,BX50计算盒子支持32路视频分析与本地大模型运行 [4] 技术突破 - M50采用第二代SRAM-CIM双端口存算架构,支持权重加载和矩阵计算同时进行,实现多精度混合运算 [3] - 自主研发第二代IPU架构天璇通过压缩自适应计算周期实现弹性计算,最高提供160%加速效果 [3] - 内建高速多芯互联技术实现算力与带宽扩展,适配后摩大道®编译器自动选择最优算子,支持浮点运算无需量化调优 [4] - 相比传统架构能效提升5~10倍,完美适配端边设备"算得快又吃得少"需求 [4] 应用场景 - 产品可广泛应用于消费终端、智能办公、智能工业等领域,支持全流程本地离线处理 [5] - 消费终端赋能笔记本、平板等设备本地大模型推理,实现智能交互与内容生成 [5] - 智能办公场景支持断网环境下多语种翻译、纪要生成 [5] - 智能工业领域实现产线质检与车路云协同实时分析决策,生产数据设备端闭环处理 [5] 战略布局 - 公司已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽,能效较现有水平再提升三倍 [5] - 技术路线旨在推动百亿参数大模型在终端设备普及,使AI算力融入PC、平板等日常设备 [5] - 近两年获得中国移动产业链发展基金、北京市人工智能基金等多家机构投资支持 [6] 行业影响 - 公司通过存算一体技术与大模型深度融合,构建"低功耗、高安全、好体验"的端边智能新生态 [5] - 技术路径实现"离线可用、数据留痕不外露",解决云端传输隐患 [5] - 目标让大模型算力像电力一样随处可得,走进产线、设备和用户指尖 [8]