GPNPU架构
搜索文档
云天励飞:目前在研Nova 500系列将全面升级GPNPU架构
巨潮资讯· 2025-12-10 21:37
公司技术研发与产品进展 - 公司是全球第一批提出并商业化落地NPU驱动AI推理芯片概念的公司 已完成四代NPU的研发和商业化[1] - 公司在研的Nova 500系列将全面升级GPNPU架构 通过3D堆叠存储与软硬协同设计 实现生态兼容性 性能与能效三重提升 更适合AI推理应用[1] - 公司于2024年推出的IPU-X6000加速卡已开始与软件企业 AI应用企业 互联网厂商等多个客户进行研发对接 生态融合并开始商业化应用[1] - 公司以NPU为核心 将推出GPNPU架构 走“推理优先架构”路线 在矩阵/向量单元 存储层级和带宽利用上深度优化 目标是实现推理效率百倍级提升[1] - 公司计划在四代NPU基础上研发第五代GPNPU架构 核心路径是融合GPU通用性与NPU高能效 以“算力积木”设计和3D堆叠存储为核心创新[2] 公司商业合作与生态建设 - 2025年11月 公司与金蝶软件达成战略合作 双方共同打造“国产算力引擎+企业级软件生态”的融合标杆 推动公司AI推理能力嵌入更广泛的企业数字化流程[1] 行业趋势与公司战略定位 - “推理异构化”已成为行业趋势[2] - 公司第五代GPNPU架构聚焦提升资本开支Token转化率与运营开支Token转化率 通过全栈协同优化 为大模型组合应用与复合智能体部署提供核心算力支撑 目标是实现“百万Token的极致性价比”[2]
云天励飞陈宁对话Hinton:推理时代来临 GPNPU架构如何破局?
证券日报· 2025-12-03 14:41
行业趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,未来需探索模拟计算、类脑芯片及基于类器官的计算等新形态[3] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,推理/处理芯片有望达到4万亿美元,占比约80%[3] - 2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段[5] 技术发展路径 - 未来AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备中,实现无处不在的按需取用[3] - “推理异构化”成为行业趋势,单一芯片难以兼顾AI任务中高算力的需求理解阶段与高带宽的答案生成阶段[6] - 行业核心竞争力将聚焦于芯片架构的灵活适配能力,以应对多模型混合应用的常态[6] 公司战略与创新 - 公司以NPU为核心,推出GPNPU架构,走“推理优先架构”路线,目标实现推理效率百倍级提升[5] - 公司研发第五代GPNPU架构,核心是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新[6] - 公司致力于通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”[6] 公司竞争优势 - 公司自2005年参与并行计算指令集与芯片架构设计,掌握算法芯片化的第一性原理,可实现软硬结合的高性价比设计[7] - 公司沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才[7] - 公司地处粤港澳大湾区,可利用全球最完善的人工智能与机电一体化产业链,以及深圳的芯片设计、硬件制造、供应链与营销网络,以市场需求驱动研发[7] 行业生态与愿景 - 真正有意义的AI必须让更多人用得起、用得上,当AI使用成本接近水电气基础设施水平时,才能惠及偏远地区学生、基层医院和中小企业[4] - 公司呼吁建立全球统一的推理算力网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域[7]