龙虾AI学习机 - 财报，业绩电话会，研报，新闻

龙虾AI学习机

搜索文档

是说芯语· 2026-04-23 08:22

文章核心观点 - 2025年是“端侧AI元年”，全球端侧AI市场预计从2025年的3219亿元增长至2029年的1.2万亿元，复合年增长率达39.6%，催生了对低功耗、高性能端侧AI芯片的海量需求 [1] - 行业面临三大核心痛点：1)“功耗-算力-成本”的不可能三角；2)“内存墙”难题突出，带宽利用率普遍不足50%；3)场景适配的矛盾 [1][2] - 当前主流技术路径（传统GPU/NPU架构和常规TPU/ASIC架构）均存在局限，导致行业陷入“两难困境”：要么高功耗、高算力、高成本，要么低功耗、低算力、场景窄 [3][4][6] - 深圳初创企业迈特芯通过技术、模式、定位三重创新，依托3D分布式TPU技术（LPU路线）、类矿机可扩展模式和聚焦“龙虾终端”的场景定位，为行业提供了差异化的破局路径 [7][8][21][24] 行业机遇与痛点总结 - **市场机遇**：全球端侧AI市场预计从2025年的3219亿元增长至2029年的1.2万亿元，复合年增长率高达39.6% [1] - **核心痛点一：不可能三角**：端侧终端对功耗要求严苛（通常5W以内），但运行7B以上全量级大模型需要高算力，导致功耗、算力、成本难以平衡 [1] - **核心痛点二：内存墙**：传统平面IO设计导致计算单元与内存间数据搬运能耗高、效率低，带宽利用率普遍不足50%，制约推理速度并推高功耗 [2] - **核心痛点三：场景适配矛盾**：产品要么追求全场景覆盖导致泛化，要么局限于单一场景导致市场覆盖面窄，难以适配“多场景融合”趋势及开源智能体的新要求 [2] 主流技术路径分化与局限 - **路径一：传统GPU/NPU架构** - 主导企业为国际巨头（如Arm、英伟达） [4] - 核心优势：技术成熟，算力强劲，可稳定运行大模型 [4] - 核心短板：功耗高（10W以上，Arm AGI CPU-1达300W）、生态封闭、成本高、依赖海外IP [4] - **路径二：常规TPU/ASIC架构** - 主导企业为国内多数同行 [4] - 核心优势：功耗较低（5W左右）、适配小型终端、成本适中 [4][6] - 核心短板：算力不足（多局限于4B以下模型）、内存墙未解决、场景适配单一、国产化不足 [4][6] - **行业困境**：两条主流路径导致“两难困境”——要么高功耗、高算力、高成本，要么低功耗、低算力、场景窄 [6] 迈特芯的破局之道：三重创新 - **技术创新：3D分布式TPU与LPU技术路线** - 核心技术为3D分布式TPU，是LPU技术路线的底层核心架构 [7][8] - 采用立方脉动架构与3D分布式IO（3D-DRAM近存计算）深度融合，已通过全国产28nm工艺流片 [8] - **产品性能亮点**（基于LPU技术路线）： - LPU base：功耗5W，带宽400GBps，带宽利用率≥75%，推理速度80 TPS，词元能效16 TPS/W，适配2-4B模型 [10] - LPU pro：功耗10W，带宽600GBps，带宽利用率≥75%，推理速度80 TPS，词元能效8 TPS/W，适配9B模型 [10] - LPU pro+：功耗40W，带宽2400GBps，带宽利用率≥75%，推理速度135 TPS，词元能效3.38 TPS/W，适配27-35B模型 [10] - **技术价值体现**： - 彻底解决“内存墙”：带宽利用率提升至80%左右，远超国内同行50%以下的平均水平 [10][11] - 实现能效比跨越式提升：5W可稳定运行2-9B模型，性能媲美高端芯片，功耗降低一个量级 [12] - 国产化落地领先：核心架构、IP全自研，基于全国产工艺，已完成Qwen、GLM、miniCPM等主流开源大模型部署 [12] - **模式创新：类矿机可扩展模式** - 核心逻辑是模块化设计，借鉴矿机可堆叠、可扩展特性 [21][23] - 让LPU系列产品（单芯片、推理卡、类矿机）能根据场景需求灵活调整算力规模，实现“灵活适配+成本优化” [23] - 与3D分布式TPU低功耗特性深度协同，打破“一款芯片对应一个场景”的固有模式 [23] - **定位创新：聚焦“龙虾终端”** - 核心是适配开源AI智能体“龙虾”（OpenClaw）的本地化运行需求 [24][25] - 为龙虾智能体提供低功耗、高性能的本地算力支撑，并通过可扩展模式适配其在不同终端场景的算力需求 [25] - 优势在于“精准性与扩展性的平衡”，避免了国际巨头的泛化问题和国内同行的单一场景局限 [26] - 已与麒麟软件、全志科技等上下游企业展开生态联合 [26] 迈特芯产品矩阵与规划 - **主打产品系列**： - LPU base系列：聚焦AI pad等消费电子终端，平均功耗5W，推理速度大于80 Token/s [27] - LPU pro系列：聚焦机械臂、工业控制场景，提供轻量化、低成本的本地推理解决方案 [27] - LPU pro+系列：侧重边缘NAS盒子、PC及token工厂等场景，提供高性能低成本解决方案 [27] - **推理芯片产品矩阵**： - Base系列（MC_mega_188）：3D DRAM容量2.5GB，适配0.5B-3B模型 [16] - Pro系列（MC_mega_288/488）：3D DRAM容量5GB/10GB，适配4B-9B模型 [17] - Pro+系列（4芯片MC_mega_488）：3D DRAM容量40GB，适配27B/35B模型 [18] - Pro Max系列（8芯片MC_mega_488）：3D DRAM容量80GB，适配122B模型 [19] - **公司发展里程碑**： - 2023年：ASIC投片验证TPU [31] - 2024年：FPGA原型机验证分布式IO大模型 [31] - 2025年：全国产3D工艺设计 [31] - 2026年：流片量产3D分布式TPU芯片及推理卡，计划年底实现样片量产 [31] - 2027年：计划大规模落地，并持续迭代14nm/7nm工艺 [31] 竞争格局与迈特芯差异化优势 - **竞争格局**： - 国际巨头（如英伟达、高通）：在高端市场占主导，但存在功耗高（英伟达）或架构传统、能效比不及LPU（高通）的短板 [29] - 国内同行：多采用常规2D IO或传统NoC路线，架构利用率低、功耗高、难扩展，或无法解决3D堆叠散热问题 [29] - **迈特芯协同优势**： - 技术优势：LPU路线依托3D分布式TPU架构，在带宽利用率、能效比、推理速度上达到国际先进水平，且基于全国产工艺 [30] - 模式优势：类矿机可扩展模式解决了规模化落地难题 [30] - 定位优势：聚焦龙虾终端实现了场景的精准适配 [30] - 形成“技术-模式-定位”三者协同的壁垒，区别于国际巨头和国内同行的局限 [30]