云天励飞披露大算力芯片战略,要把推理成本降低百倍以上

公司战略发布 - 云天励飞于2月3日在深圳举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯片战略布局 [2] - 公司宣布将核心研发资源集中于攻克大模型落地的成本壁垒,致力于通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标 [2] - 公司确立了GPNPU技术路线,其核心公式为“GPNPU = GPGPU + NPU + 3D堆叠存储”,旨在兼顾通用计算的通用性与NPU的高效性,解决可迁移、可部署、可持续降本三大工程难题 [5] - 公司未来将以GPNPU架构为核心,大力推进云端大算力,强化软硬协同与存储体系攻坚 [6] 行业趋势分析 - 过去一年,全球算力产业的重心正加速向推理侧倾斜 [4] - 谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化 [4] - 2025年12月,英伟达与Groq达成非独占许可安排,并吸纳其核心工程人才团队,此举被视为强化推理与实时工作负载能力的关键布局 [4] - 行业趋势表明,推理侧竞争已从“把模型做得更强”的参数竞赛,转向“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率成为规模化落地的最大门槛 [4] - 推理时代的胜负手在于系统级协同,需要既能承接主流软件生态,又能在推理负载下实现更优能效与更低时延 [4] - 推理时代的竞争本质是“单位推理成本”的竞争,只有把推理做得足够便宜、稳定、易用,AI才能从“看得见的能力”走向“用得起的生产力” [6] 公司核心竞争力与保障 - 公司董事长兼CEO陈宁将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素,这五大维度的协同共振为公司应对竞争和战略落地提供了体系化保障 [5] - 针对供应链安全问题,公司高级副总裁、CFO兼董秘邓浩然表示,公司是目前国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为芯片的大规模量产与交付提供了极高的确定性 [5] - 公司CTO李爱军表示,将不遗力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求 [5] 技术路线与产品规划 - 公司技术路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化 [6] - 目标是在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标 [6] - 公司致力于推动大模型从示范应用走向规模化交付 [6]