产业趋势:推理侧成为算力竞争新焦点 - 全球算力产业重心正加速向推理侧倾斜,行业竞争从“参数内卷”转向“效能为王”[3] - 谷歌在2025年4月发布第七代TPU “Ironwood”时,明确将其定位为“面向推理时代”的基石[3] - 2025年12月,英伟达与Groq达成非独占许可安排并吸纳其核心工程团队,被视为强化推理与实时工作负载能力的关键布局[3] - 单位推理成本与交付效率已成为AI规模化落地的最大门槛[3] 公司战略:聚焦大算力AI推理芯片与降本目标 - 公司核心战略是集中研发资源攻克大模型落地的“成本壁垒”,通过底层架构创新推动AI普惠化[1] - 未来三年目标是通过GPNPU架构等创新,力争实现百万Tokens推理成本降低100倍以上[1][10] - 公司确立了“1+4”架构:“1”指聚焦AI大算力推理芯片,“4”指四大事业部,旨在解决芯片从研发到市场推广的核心难题[8] - 计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆[8][9] 技术路线:GPNPU架构兼顾通用生态与极致能效 - 公司提出GPNPU技术路线,核心公式为“GPNPU = GPGPU + NPU + 3D堆叠存储”,旨在兼顾通用性与高效性[4] - 在通用生态层面,GPNPU架构致力于实现一行代码完成CUDA程序兼容,以降低生产系统迁移门槛[4] - 在推理能效层面,NPU能实现更高计算效率和能效比,专用化设计易转化为真实成本优势[4] - 针对“内存墙”瓶颈,公司正深度研发3D堆叠存储及更前沿互连技术,以提升带宽与能效,降低时延[5] 产品与工程优势:系统级优化与弹性扩展 - 公司采用“算力积木”架构,通过Chiplet扩展与互连思路,将标准计算单元模块化封装与组合,实现从边缘到大规模推理的弹性产品形态[5] - 公司拒绝单纯的“芯片参数竞赛”,主张将“模型怎么跑得更省”沉淀到架构里,围绕真实业务负载进行系统级优化,逐项击穿推理链路中的成本与时延瓶颈[7] - 未来将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐持续迭代,并按产品节奏梯度覆盖市场需求[10] - 路线图将聚焦长上下文预填充、低时延解码等关键推理阶段的系统优化,在真实负载下兑现“更便宜、更稳定、更易部署”的目标[10] 核心竞争力:五大要素构筑护城河 - 公司核心竞争力总结为技术、产能、生态、市场、资本五大关键要素,为未来三年战略落地提供体系化保障[8] - 针对供应链安全,公司是目前国内屈指可数手握充足国产产能保障的企业之一,为芯片大规模量产与交付提供了高确定性[8] - 四大事业部中,政企事业部作为基石,将战略重点转向推理设备和智算中心的建设[8]
云天励飞发布未来三年大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上