Workflow
大算力AI推理芯片
icon
搜索文档
云天励飞发布未来三年大算力芯片战略,国内算力有望进入新一轮周期
每日经济新闻· 2026-02-04 14:37
中证信创指数及信创ETF市场表现 - 截至当日14点17分,中证信息技术应用创新产业指数下跌2.73% [1] - 成分股表现分化,博睿数据领涨6.74%,格尔软件上涨5.47%,赢时胜上涨4.97% [1] - 成分股中泛微网络领跌9.99%,卓易信息下跌9.41%,福昕软件下跌7.44% [1] - 信创ETF下跌2.62%,最新报价为1.49元 [1] - 信创ETF盘中换手率达10.4%,成交额达4499.60万元,市场交投活跃 [1] - 信创ETF近1周份额增长900.00万份,新增份额位居可比基金前三分之一 [1] - 信创ETF最新资金净流入605.38万元 [1] - 近5个交易日内有4日资金净流入,合计净流入1573.09万元,日均净流入314.62万元 [1] 行业动态与公司战略 - 云天励飞首次公布未来三年大算力AI推理芯片战略布局,将核心研发资源集中于攻克大模型落地成本壁垒 [1] - 云天励飞以GPNPU架构为核心,目标实现百万Tokens推理成本降低100倍以上 [1] 行业前景与催化剂 - 银河证券认为,需求催化与密集招标有望推动国内算力进入新一轮周期 [2] - 英伟达H200芯片有望有条件进入中国市场,长期看有利于国产算力芯片及生态发展 [2] - 预计2025年四季度国内AIDC招标开始回暖并呈现上行趋势 [2] - 预计2026年国内互联网大厂将加紧数据中心布局,节奏或将快于2025年 [2] - 若H200恢复供应将推动大模型训练效率,加速AI应用端落地与国产算力芯片在推理端需求 [2] 相关ETF产品概况 - 信创ETF紧密跟踪中证信创指数,突出国产全栈替代,涵盖存储芯片、CPU、AIPC等关键环节 [2] - 信创ETF积极融入DeepSeek生态与AI应用,相关成分股权重分别为72%与58% [2] - 信创ETF构建从底层硬件到行业智能的安全可控体系,政策确定性强 [2] - 信创ETF目前为同类规模最大的ETF [2]
云天励飞披露大算力芯片战略,要把推理成本降低百倍以上
南方都市报· 2026-02-03 23:08
公司战略发布 - 云天励飞于2月3日在深圳举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯片战略布局 [2] - 公司宣布将核心研发资源集中于攻克大模型落地的成本壁垒,致力于通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标 [2] - 公司确立了GPNPU技术路线,其核心公式为“GPNPU = GPGPU + NPU + 3D堆叠存储”,旨在兼顾通用计算的通用性与NPU的高效性,解决可迁移、可部署、可持续降本三大工程难题 [5] - 公司未来将以GPNPU架构为核心,大力推进云端大算力,强化软硬协同与存储体系攻坚 [6] 行业趋势分析 - 过去一年,全球算力产业的重心正加速向推理侧倾斜 [4] - 谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化 [4] - 2025年12月,英伟达与Groq达成非独占许可安排,并吸纳其核心工程人才团队,此举被视为强化推理与实时工作负载能力的关键布局 [4] - 行业趋势表明,推理侧竞争已从“把模型做得更强”的参数竞赛,转向“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率成为规模化落地的最大门槛 [4] - 推理时代的胜负手在于系统级协同,需要既能承接主流软件生态,又能在推理负载下实现更优能效与更低时延 [4] - 推理时代的竞争本质是“单位推理成本”的竞争,只有把推理做得足够便宜、稳定、易用,AI才能从“看得见的能力”走向“用得起的生产力” [6] 公司核心竞争力与保障 - 公司董事长兼CEO陈宁将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素,这五大维度的协同共振为公司应对竞争和战略落地提供了体系化保障 [5] - 针对供应链安全问题,公司高级副总裁、CFO兼董秘邓浩然表示,公司是目前国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为芯片的大规模量产与交付提供了极高的确定性 [5] - 公司CTO李爱军表示,将不遗力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求 [5] 技术路线与产品规划 - 公司技术路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化 [6] - 目标是在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标 [6] - 公司致力于推动大模型从示范应用走向规模化交付 [6]
云天励飞发布未来三年大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上
格隆汇· 2026-02-03 20:49
产业趋势:推理侧成为算力竞争新焦点 - 全球算力产业重心正加速向推理侧倾斜,行业竞争从“参数内卷”转向“效能为王”[3] - 谷歌在2025年4月发布第七代TPU “Ironwood”时,明确将其定位为“面向推理时代”的基石[3] - 2025年12月,英伟达与Groq达成非独占许可安排并吸纳其核心工程团队,被视为强化推理与实时工作负载能力的关键布局[3] - 单位推理成本与交付效率已成为AI规模化落地的最大门槛[3] 公司战略:聚焦大算力AI推理芯片与降本目标 - 公司核心战略是集中研发资源攻克大模型落地的“成本壁垒”,通过底层架构创新推动AI普惠化[1] - 未来三年目标是通过GPNPU架构等创新,力争实现百万Tokens推理成本降低100倍以上[1][10] - 公司确立了“1+4”架构:“1”指聚焦AI大算力推理芯片,“4”指四大事业部,旨在解决芯片从研发到市场推广的核心难题[8] - 计划打造区域级“千卡集群”,树立城市AI算力赋能的新标杆[8][9] 技术路线:GPNPU架构兼顾通用生态与极致能效 - 公司提出GPNPU技术路线,核心公式为“GPNPU = GPGPU + NPU + 3D堆叠存储”,旨在兼顾通用性与高效性[4] - 在通用生态层面,GPNPU架构致力于实现一行代码完成CUDA程序兼容,以降低生产系统迁移门槛[4] - 在推理能效层面,NPU能实现更高计算效率和能效比,专用化设计易转化为真实成本优势[4] - 针对“内存墙”瓶颈,公司正深度研发3D堆叠存储及更前沿互连技术,以提升带宽与能效,降低时延[5] 产品与工程优势:系统级优化与弹性扩展 - 公司采用“算力积木”架构,通过Chiplet扩展与互连思路,将标准计算单元模块化封装与组合,实现从边缘到大规模推理的弹性产品形态[5] - 公司拒绝单纯的“芯片参数竞赛”,主张将“模型怎么跑得更省”沉淀到架构里,围绕真实业务负载进行系统级优化,逐项击穿推理链路中的成本与时延瓶颈[7] - 未来将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐持续迭代,并按产品节奏梯度覆盖市场需求[10] - 路线图将聚焦长上下文预填充、低时延解码等关键推理阶段的系统优化,在真实负载下兑现“更便宜、更稳定、更易部署”的目标[10] 核心竞争力:五大要素构筑护城河 - 公司核心竞争力总结为技术、产能、生态、市场、资本五大关键要素,为未来三年战略落地提供体系化保障[8] - 针对供应链安全,公司是目前国内屈指可数手握充足国产产能保障的企业之一,为芯片大规模量产与交付提供了高确定性[8] - 四大事业部中,政企事业部作为基石,将战略重点转向推理设备和智算中心的建设[8]