Workflow
对话「后摩智能」吴强:从科学家到创业者的惊险一跃
创业创业(US:VEMLY) 36氪·2025-08-06 08:02

行业趋势 - AI算力呈现云端和端边侧两极发展趋势 云端算力持续扩展 端边侧应用火热 [1] - 未来生成式AI推理计算90%在端侧和边侧进行 仅10%复杂任务需云端处理 [1] - 端边侧市场正孕育"下一个英伟达"机会 可能比云端市场更大且容纳更多玩家 [2] 技术架构创新 - 存算一体技术突破冯诺依曼架构的"内存墙"和"功耗墙"问题 直接在存储单元进行矩阵乘加操作消除数据搬运流程 [2] - 存算一体对先进制程依赖更弱 因数据搬运次数减少 [18] - 行业处于存算一体百花齐放阶段 介质包括Nor-flash/SRAM/DRAM/RRAM 后摩聚焦SRAM和DRAM的高精度大算力存算 [13] 产品性能表现 - 后摩漫界M50芯片实现160 TOPS@INT8和100 TFLOPS@bFP16物理算力 搭配48GB内存与153.6GB/s带宽 典型功耗仅10W [6] - 支持7B到70B参数本地大模型运行 适配X86/ARM等主流处理器架构 [6][7] - 采用自研"天璇架构"IPU和"后摩大道"编译器工具链 支持主流深度学习框架 [6] 商业化进展 - 已获得联想AI PC 讯飞听见智能语音设备 中国移动5G+AI等标杆意向客户 [7][10] - 重点布局消费终端/智能办公/智能工业/机器人领域 端侧市场具有成本敏感和功耗敏感特性 [10][11] - 端边侧芯片需满足小型化 高散热要求 且不能是大尺寸卡型设计 [11] 公司战略转型 - 从智能驾驶芯片转向通用端边大模型AI芯片 因智驾赛道竞争激烈且算力需求与市场不匹配 [8] - 2024年初推出M30芯片试水大模型计算 2025年发布M50芯片完成转型 [9][3] - 存算一体技术与大模型计算天然契合 既需要大算力又需要大带宽 [9] 技术落地挑战 - 存算一体产品化需解决电路设计 量产工程问题 AI处理器架构三大卡点 [14] - 需开发专用EDA工具解决可测性和良率问题 并克服高计算密度带来的电压降等工程难题 [14] - 软件编译器需对客户无感 支持PyTorch/TensorFlow等主流框架 [17] 市场竞争格局 - NPU与SOC/CPU厂商存在能力壁垒 独立NPU在AI计算需求无限场景下将持续发展 [19][20] - 存算一体获国家政策支持 参与发改委/工信部闭门座谈 投资机构关注度显著提升 [12]