Workflow
GPNPU架构
icon
搜索文档
【点金互动易】大飞机+特斯拉+飞行汽车,配套商飞C919、C909,空客A220等机型,特斯拉为其客户,这家公司为小鹏汇天提供零部件产品
财联社· 2026-01-20 09:10
文章核心观点 - 文章介绍了两家分别在大飞机产业链和人工智能计算领域具备核心技术与重要客户的公司 [1] 大飞机与新能源汽车产业链公司 - 公司业务横跨大飞机、特斯拉及飞行汽车领域 [1] - 公司为国产大飞机C919和C909以及空客A220等机型提供配套 [1] - 特斯拉是公司的客户之一 [1] - 公司为小鹏汇天提供零部件产品 [1] 人工智能与航天计算公司 - 公司业务涉及NPU(神经网络处理器)和太空计算 [1] - 公司为深空探测实验室的自主可控星载计算提供技术支撑 [1] - 公司承担了国家科技部重大专项并已通过验收 [1] - 公司以NPU为核心,计划推出GPNPU架构 [1]
云天励飞:公司以NPU为核心,将推出GPNPU架构
证券日报· 2026-01-19 22:17
公司战略与技术路线 - 公司进入大模型和智能体时代,以“高效AI、普惠AI”为发展方向 [2] - 公司以“推理优先架构”为技术抓手,主动参与全球算力体系重构与标准构建 [2] - 公司将持续在新算力体系、安全治理与普惠应用三条主线深耕 [2] 行业挑战与公司解决方案 - 进入大模型和智能体时代,算力成本急剧攀升,算力效率将成为AI发展下一阶段的关键瓶颈 [2] - 公司以NPU为核心,将推出GPNPU架构,走“推理优先架构”路线 [2] - 公司在矩阵/向量单元、存储层级和带宽利用上进行深度优化 [2] 具体性能目标 - 公司技术优化的目标是将100万个token的生成成本,从约1美元压到1美分 [2] - 此举旨在实现百倍级效率提升 [2]
云天励飞:锚定算力架构创新 破解AI规模化应用难题
中国证券报· 2026-01-08 04:50
行业范式变迁 - 人工智能产业的价值逻辑正从“训练竞赛”转向“推理效能” [1] - 行业焦点从追求庞大模型参数转向关注在真实业务场景中以可控成本、能耗和安全标准实现AI能力长期稳定运行 [1] - 范式变迁的核心是“规模化交付”能力 [1] 公司战略定位 - 公司将战略核心清晰锚定在“推理侧”致力于打造中国版TPU [2] - 提出“一个目标、三条路径”的推进框架:围绕大模型时代的规模化推理需求打造中国版TPU核心目标并通过“研发协同”“场景牵引”“生态共建”三条路径推动闭环落地 [2] - 未来三至五年将重点发力云端AI推理和具身智能机器人两大新兴市场并已构建DeepEdge、DeepVerse、DeepXbot三大芯片产品矩阵 [5] 技术架构与产品 - 公司拥有独特的GPNPU架构和聚焦推理侧的战略定位 [1] - 自主创新的“算力积木”架构通过Chiplet技术能够将标准计算单元灵活封装成从8T到256T不等的多样化算力形态 [3] - GPNPU架构旨在解决通用计算与专用计算之间的矛盾兼容二者优势 [4] - 正在研发Nova500系列芯片目标是将大模型推理成本降至“百万Token一元钱”甚至更低 [4] - 深度研发3D堆叠存储技术并探索光电一体化互联等前沿方向以提升性能与能效 [4] 市场应用与落地 - 在企业级应用领域打造了AI推理服务器、智算集群等系列产品落地了16亿元智算订单 [3] - 在机器人领域赋能的送餐机器人、消杀机器人等多种类型服务机器人已在酒店、餐厅等场景落地 [3] - 在智慧交通领域搭载自研芯片的边缘AI产品落地深圳上千辆公交车赋能智慧公交OD系统 [3] - 在儿童AI硬件领域子公司噜咔博士推出AI拍学机旗下岍丞技术的产品2024年全年累计出货量已超三千万套 [3] 区域生态优势 - 粤港澳大湾区完备的产业生态为公司将技术优势转化为市场胜势提供了最佳舞台 [1] - 粤港澳大湾区在“机电一体化”、智能硬件产业链与应用场景方面具备较为完备的产业基础与协同条件为AI推理产品的工程化落地提供了持续验证、快速迭代的空间 [2] - 粤港澳大湾区在人工智能产业领域具备“科研—工程—制造—应用”的短链条优势是难以比拟的创新土壤 [3] - 深圳高密度的城市治理、公共安全、智慧生活等需求为AI工程化提供了“压力测试场” [3] - 粤港澳大湾区拥有全球领先的硬件制造与供应链能力是发展具身智能的天然主场 [5]
云天励飞董事长:打造中国版TPU
21世纪经济报道· 2026-01-02 22:38
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更具长期价值的AI推理芯片赛道[3] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[7] - 公司并未盲目追随GPU路线或切入训练芯片赛道,而是立足自身技术积累,坚持符合自身节奏的发展道路[8] - 公司营收结构变化与AI行业发展阶段匹配,早期以行业解决方案为主,大模型阶段出现标品和服务,未来推理算力市场爆发将带动推理芯片出货量增长拐点[19][20] 对AI推理芯片市场的判断 - 公司董事长陈宁认为,训练芯片市场规模远无法与未来推理芯片的市场潜力相比,推理环节才是将AI转化为现实生产力的关键[11][13] - 据公司判断,到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[14] - 2025年将是重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化,形成独立的技术路径和产品体系[15] - 中国真正的机会和主战场在推理芯片赛道,这里市场空间更大,也更契合中国应用驱动、产业落地见长的发展优势[14] 公司技术与产品进展 - 公司最新提出GPNPU架构,可理解为中国版TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[16] - GPNPU架构融合了GPU的可编程性与生态兼容性、NPU的高能效优势,并深度融合存算一体技术[16] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,同时保持价格优势[16] - 公司第一代芯片至今仍在龙岗区政府部门稳定运行,并通过端到端的应用闭环验证芯片实际价值,构建了覆盖应用、算法与芯片的全栈能力[6] 客户与市场需求 - 当前芯片订单需求最明确的客户是互联网头部大厂,第二梯队包括三大通信运营商及部分中大型互联网企业,第三类客户是AI领域的创业公司[17] - 互联网大厂是推理芯片的终极目标客户,其每年的采购额达上千亿,只要成为其第三、第四供应商,订单规模可达几十亿、上百亿[18] - 互联网大厂通常会采用多家供应商的策略,以保障供应链安全和满足不同产品线需求[18] 行业发展与竞争格局 - AI推理芯片时代正在形成市场共识,推理已进入算力中心舞台,未来AI赛场将构建起更加繁荣的推理芯片和应用生态[3][4] - 英伟达收购专注于AI推理芯片的Groq,进一步强化了推理基础设施加速演进的行业信号[14] - 中国AI发展模式是应用驱动,强调技术落地到产业场景,国家政策明确推动AI规模化落地,到2027年新一代智能终端、智能体等应用普及率目标超70%,到2030年目标超90%[9] - 中国在大模型上已基本追平、进入全球第一梯队,接下来的重点是鼓励大规模市场化应用,加速AI在各行各业渗透,而高效运行的推理芯片是亟需补齐的关键环节[10] 面临的挑战与应对 - 芯片研发和市场推进的挑战包括硬件本身的复杂性、软件生态的构建以及AI技术的快速演进[23][24] - 公司研发投入聚焦于行业即将爆发的关键节点,以构建核心竞争力,重点包括加强GPNPU架构与主流生态的兼容性、优化NPU架构以及聚焦3D堆叠与存算一体等未来大算力技术[21][22] - 半导体市场的并购活动将越来越多,原因是AI应用和AI推理两大生态快速崛起催生大量新机会,公司自身也在积极筹备多支产业基金进行布局[25] 区域产业环境 - 广东省对集成电路产业高度重视,明确提出应用场景开放驱动AI与集成电路产业发展的战略思路,具有全国前瞻性[26] - 粤港澳大湾区被英伟达CEO称为“全球唯一一个AI与机电一体化深度融合的区域”,其核心竞争力在于不仅是AI算法和软件的试验场,更是AI原生硬件的策源地[26] - 深圳产业政策聚焦,早在五六年前就明确提出要发展NPU芯片产业,这种长期稳定的政策支持使企业能坚持深耕技术研发[27] - 深圳涌现大量AI硬件公司,堪称AI产品经理的摇篮,其产品经理能敏锐捕捉真实需求并清楚大模型能力边界,做出务实、可落地的产品[28]
云天励飞董事长:打造中国版TPU
21世纪经济报道· 2026-01-02 22:33
公司战略与定位 - 公司已从AI解决方案提供商,转向更底层、更具长期价值的AI推理芯片赛道[3] - 公司的战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[8] - 公司并未盲目追随GPU路线或贸然切入训练芯片赛道,而是立足自身技术积累和产业定位,坚持走符合自身发展节奏的道路[9] - 公司营收结构的变化与AI行业发展阶段完全匹配:早期以行业解决方案为主,大模型阶段出现标品和服务,接下来推理算力市场爆发将带动推理芯片出货量增长[20] 对AI推理芯片时代的判断 - AI推理芯片时代正在形成市场共识,推理已进入算力的中心舞台,未来AI赛场将构建起更加繁荣的推理芯片和应用生态[4] - 训练芯片市场规模远无法与未来推理芯片的市场潜力相比,据判断,到2030年全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[12] - 2025年将是一个重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化,形成独立的技术路径和产品体系[14] - 推理环节是真正的“电动机”和“输电网络”,它把训练好的模型部署到实际场景中,让AI真正成为现实生产力[12] - 英伟达收购专注于AI推理芯片的Groq,进一步强化了推理基础设施加速演进的行业信号[13] 中美AI发展路径与中国的机会 - 美国AI发展模式更偏向“从0到1”的原始创新,以理论驱动为主;中国则更多是应用驱动,强调将技术落地到产业场景中[10] - 中国的强项在于将已有技术快速转化为规模化、可落地的应用,因此中国不应只聚焦于训练芯片,更应重视推理芯片的巨大机会[10] - 中国的大模型发展已取得显著进展,基本追平并进入全球第一梯队,接下来的重点是鼓励大规模市场化应用,加速AI在各行各业的渗透[11] - 从长远和更具战略意义的角度看,中国真正的机会和主战场在推理芯片赛道,这里市场空间更大,也更契合中国以应用驱动、产业落地见长的发展优势[13] 公司技术路径与产品 - 公司始终在坚持做芯片,2014年回国创业申报的第一个项目就是关于神经网络处理器(NPU)的研究[7] - 公司通过端到端的应用闭环来验证芯片的实际价值,并逐步构建起覆盖应用、算法与芯片的全栈能力[7] - 公司最新提出GPNPU架构,可理解为中国版的TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[15] - GPNPU架构融合了三方面核心优势:借鉴GPU的可编程性与生态兼容性;继承NPU在推理任务中的高能效优势;深度融合存算一体技术[15] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,价格还能有一定优势[15] 市场与客户 - 公司芯片订单需求主要来自三个领域:第一是互联网头部大厂;第二是三大通信运营商以及部分中大型互联网企业;第三是AI领域的创业公司[16] - 互联网大厂是推理芯片的终极目标客户,它们每年的采购额都是上千亿,只要做到第三、第四供应商,都是几十亿、上百亿的订单规模[18] - 大模型的使用已从技术圈扩展到普通大众,用户行为的转变在2025年真正成型,类似于2007年iPhone发布后的拐点[14] 研发挑战与投入 - 公司研发投入的重点方向包括:加强GPNPU架构与主流生态的兼容性扩展;基于近20年积累优化NPU架构;聚焦3D堆叠与存算一体等突破先进制程限制的技术[21] - 推理芯片研发和市场推进的挑战包括:硬件本身设计、流片到量产的高投入与长周期;软件生态的构建;以及应对AI技术快速演进所需的前瞻性与灵活性[22] - 芯片设计是一门艺术,是在性能、功耗、面积与成本之间不断权衡与优化的过程[15] 行业趋势与区域发展 - AI应用和AI推理两大生态正在快速崛起,催生出大量新机会,预计半导体市场的并购活动将越来越多[23] - 广东省明确提出应用场景开放驱动AI与集成电路产业发展的战略思路,具有全国前瞻性[24] - 粤港澳大湾区被英伟达CEO称为“全球唯一一个AI与机电一体化深度融合的区域”,其核心竞争力在于不仅是AI算法和软件的试验场,更是AI原生硬件的策源地[24] - 深圳堪称AI产品经理的摇篮,对市场、用户和产业土壤的深刻理解,使其在AI硬件新阶段中持续领跑[26] - 深圳早在五六年前就旗帜鲜明地提出要发展NPU芯片产业,长期稳定的政策支持使企业能够坚持深耕并实现技术积累与产业落地的良性循环[25]
云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道· 2025-12-27 23:15
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更具长期价值的AI推理芯片赛道[4] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[7] - 公司并未盲目追随GPU路线或切入训练芯片赛道,而是立足自身技术积累和产业定位,坚持符合自身节奏的发展道路[8] - 公司通过端到端的应用闭环来验证芯片的实际价值,构建了覆盖应用、算法与芯片的全栈能力[6] - 公司营收结构变化与AI行业发展阶段匹配,早期以行业解决方案为主,大模型阶段出现标品和服务,未来推理算力市场爆发将带动推理芯片出货量增长拐点[18][19] 行业趋势与市场判断 - AI推理芯片时代正在形成市场共识,推理已进入算力的中心舞台,未来AI场上将迎来更繁荣的推理芯片和应用生态[4][5] - 到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[12] - 2025年将是重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化,形成独立的技术路径和产品体系[13] - AI推理的普及正在开启一个全新时代,AI正从实验室技术转变为嵌入生活和产业环节的基础设施,用户行为在2025年真正成型[13] - 中国AI发展模式是应用驱动,强调技术落地到产业场景,国家政策推动到2027年新一代智能终端、智能体等应用普及率超70%,到2030年超90%[9] - 中国的策略是在大模型基本追平后,重点鼓励大规模市场化应用,加速AI在各行各业渗透,而高效运行的推理芯片是亟需补齐的关键环节[10] - 半导体市场的并购活动将越来越多,原因是AI应用和AI推理两大生态快速崛起催生大量新机会[25] 技术路径与产品进展 - 公司最新提出GPNPU架构,可理解为中国版TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[14] - GPNPU架构融合了三方面核心优势:借鉴GPU的可编程性与生态兼容性、继承NPU在推理任务中的高能效优势、深度融合存算一体技术[14] - 存算一体技术是中国AI芯片实现差异化突破的重要机遇,是在先进制程工艺受限条件下构建自主可控技术体系的关键路径[14] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,同时保持价格优势[14] - 芯片设计是在性能、功耗、面积与成本之间不断权衡与优化的过程,团队拥有近20年的芯片架构设计经验,长期坚持“算法芯片化”理念[14] - 推理芯片研发面临硬件复杂性、软件生态构建以及AI技术快速演进等多方面挑战[23][24] 客户与市场机会 - 推理芯片的终极目标客户是互联网大厂,其每年的采购额达上千亿,成为其第三、第四供应商意味着几十亿、上百亿的订单规模[17] - 当前芯片订单需求最明确的来自互联网头部大厂,第二梯队包括三大通信运营商及部分中大型互联网企业,第三类是AI领域的创业公司[15] - 互联网大厂通常会采用多家供应商策略,一方面是保障供应链安全,另一方面是产品线需求不同[16] - 中国在训练芯片领域与国际存在差距,但真正的机会和主战场在推理芯片赛道,这里市场空间更大,更契合中国应用驱动的发展优势[12] 区域产业环境 - 广东省对集成电路产业高度重视,明确提出应用场景开放驱动AI与集成电路产业发展的战略思路,这在全国具有前瞻性[26] - 粤港澳大湾区被英伟达CEO称为“全球唯一一个AI与机电一体化深度融合的区域”,其核心竞争力是AI原生硬件的策源地[26] - 依托庞大的终端市场,广东已形成涵盖“端、边、云”等多元场景的完整应用生态,以实际应用为牵引,拉动芯片的强劲需求[27] - 深圳是AI产品经理的摇篮,能敏锐捕捉真实需求并做出务实、可落地的AI硬件产品,因此在AI硬件新阶段持续领跑[28] - 深圳的产业政策聚焦,早在五六年前就明确提出要发展NPU芯片产业,长期稳定的政策支持使企业能坚持深耕技术研发[27]
21专访|云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道· 2025-12-27 22:40
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更底层、更具长期价值的AI推理芯片赛道[1] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[4] - 公司坚持做芯片,并通过端到端的应用闭环来验证芯片的实际价值,已构建覆盖应用、算法与芯片的全栈能力[3] - 公司并未盲目追随GPU路线,尤其没有贸然切入训练芯片赛道,而是立足自身技术积累和产业定位[4] - 公司营收结构变化与AI行业发展阶段匹配,早期以行业解决方案为主,大模型阶段出现标品和服务,接下来推理算力市场将爆发,推理芯片出货量迎来增长拐点[16] 市场观点与行业趋势 - AI推理芯片时代正在形成市场共识,这是一个罕见的历史窗口期[1] - 在AI推理时代,所有厂商站在新的起跑线上,谁能在成本、效率和系统能力上建立优势,谁就有机会[2] - 未来硬件架构可能有更多异构组合,包括通用计算CPU、训练GPU和专门做推理的推理芯片[2] - 2025年将是重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化[8][9][10] - 大模型使用已从技术圈扩展到普通大众,用户行为的转变在2025年真正成型,类似于2007年iPhone发布后的智能机拐点[10] - 到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[8] - 英伟达收购AI推理芯片公司Groq,进一步强化了推理基础设施加速演进的行业信号[8] - AI应用和AI推理两大生态正在快速崛起,催生大量新机会,半导体市场的并购活动将越来越多[21][22] 技术路径与产品 - 云天励飞最新提出GPNPU架构,可理解为中国版的TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[11] - GPNPU架构融合三方面核心优势:借鉴GPU的可编程性与生态兼容性、继承NPU在推理任务中的高能效优势、深度融合存算一体技术[11] - 团队拥有近20年芯片架构设计经验,坚持“算法芯片化”理念[11] - 存算一体技术是中国AI芯片实现差异化突破的重要机遇,是在先进制程工艺受限条件下构建自主可控技术体系的关键路径[11][18] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,价格具有一定优势[12][13] - 芯片设计是在性能、功耗、面积与成本之间不断权衡与优化的过程[11] 客户与市场机会 - 当前芯片订单需求最明确的来自互联网头部大厂,第二梯队包括三大通信运营商及部分中大型互联网企业,第三类客户是AI领域的创业公司[14] - 互联网大厂是推理芯片的终极目标客户,其每年的采购额达上千亿,只要做到第三、第四供应商,都是几十亿、上百亿的订单规模[15] - 互联网大厂通常会采用多家供应商的策略,一方面是保障供应链安全,另一方面是产品线需求不同[15] - 中国的策略是在大模型上基本追平、进入全球第一梯队后,重点鼓励大规模市场化应用,加速AI在各行各业的渗透,而高效运行的推理芯片是亟需补齐的关键环节[5][6] - 中国真正的机会和主战场在推理芯片赛道,这里市场空间更大,也更契合中国以应用驱动、产业落地见长的发展优势[8] 发展环境与区域优势 - 中国AI发展模式更多是应用驱动,强调将技术落地到产业场景中,这与美国更偏向“从0到1”理论驱动的模式存在差异[5] - 国家政策《关于深入实施“人工智能+”行动的意见》明确提出:到2027年,新一代智能终端、智能体等应用普及率超70%;到2030年,普及率超90%,这是全球首个由国家层面明确推动AI规模化落地的战略[5] - 广东省对集成电路产业高度重视,明确提出应用场景开放驱动AI与集成电路产业发展的战略思路[23] - 粤港澳大湾区被英伟达CEO黄仁勋称为“全球唯一一个AI与机电一体化深度融合的区域”,广东的核心竞争力在于不仅是AI算法和软件的试验场,更是AI原生硬件的策源地[23] - 深圳产业政策聚焦,早在五六年前就明确提出要发展NPU芯片产业,这种长期稳定的政策支持使企业能坚持深耕[24] - 深圳堪称AI产品经理的摇篮,孕育出大量AI硬件创业公司,其成功源于对市场、用户和产业土壤的深刻理解,以及务实、可落地的产品思维[25]
专访云天励飞董事长陈宁:AI推理时代已至,推理芯片崛起将是中国科技复兴巨大机遇
每日经济新闻· 2025-12-24 16:35
行业趋势:AI产业从训练转向推理的范式革命 - 2025年被业界视为AI应用大爆发的元年,智能体正从概念走向现实,应用爆发的背后是百倍增长的推理算力需求与高昂成本之间的矛盾 [2] - 人工智能产业发展分为三个阶段:2012-2020年为“智能感知”时代;2020-2025年为“AIGC”时代;2025年进入“Agentic AI”时代,核心特征是应用爆发,所需算力从以训练为主转向以推理为主 [3] - 从训练到推理是根本性转折,训练追求极致性能和迭代速度,而推理要大规模商业化必须追求极高的性价比 [3] - 这一转变打破了英伟达凭借CUDA生态和GPGPU在训练时代建立的垄断格局,为全球参与者提供了新机遇 [4] 市场机遇:中国在推理芯片赛道的“超车”机会 - 推理芯片赛道是中国实现“超车”的关键,中国第一次与全球站在相近的起跑线 [2] - 在训练赛道上,由于先进制程受限和CUDA生态壁垒,中国追赶英伟达差距较大,但在推理赛道上全球都刚刚起步,游戏规则不同 [5] - 推理更接近应用场景,需要为用户提供更高性价比的产品,这正是中国产业所擅长的,推理芯片的崛起将是中国科技复兴的巨大机遇 [5] - 市场规律证明了推理赛道的不可替代性,谷歌在TPU战略中明确“训推分离”,博通为Meta、OpenAI定制推理芯片,都证明了独立推理赛道的崛起与巨大潜力 [5] 技术挑战与解决方案:降低推理综合成本 - 面对推理时代的需求,一味模仿英伟达的GPGPU架构并非出路,推理任务的计算范式发生根本变化,“Prefill”和“Decode”两个阶段对算力和带宽的需求截然不同 [6] - 公司提出了新的“GPNPU”架构,旨在融合三大核心能力:结合GPGPU的SIMT编程范式以兼容CUDA生态;结合指令集微架构设计优化矩阵计算硬件;基于国产工艺和先进封装技术打破内存瓶颈 [6] - GPNPU目标是在计算算力、存储带宽、存储容量三者间实现更优配比,通过高能效、低功耗等技术降低运营能源成本,全方位降低用户的总体拥有成本 [6] - 为支撑AI规模化产业化,需要在较短周期内把“百万token”的推理综合成本降低到“一分钱”级别,这需要通过架构革命和工艺创新实现 [7] 市场需求与规模:推理算力需求呈爆炸性增长 - 以豆包大模型为例,其日均Token处理量已达50万亿且增速惊人,即便以此为基础不再增长,大规模在线推理的资本与运营开支也非常可观 [7] - 有媒体报道称字节跳动2026年AI基建相关资本开支预算约1600亿元,反映出头部厂商对推理基础设施的投入强度显著抬升 [7] - 若token规模短期继续上行,明年上半年可能触及100万亿,在单位能效无显著改善的情况下,电力与散热等基础设施压力可能出现“千倍级”的数量级跃迁 [7]
云天励飞:目前在研Nova 500系列将全面升级GPNPU架构
巨潮资讯· 2025-12-10 21:37
公司技术研发与产品进展 - 公司是全球第一批提出并商业化落地NPU驱动AI推理芯片概念的公司 已完成四代NPU的研发和商业化[1] - 公司在研的Nova 500系列将全面升级GPNPU架构 通过3D堆叠存储与软硬协同设计 实现生态兼容性 性能与能效三重提升 更适合AI推理应用[1] - 公司于2024年推出的IPU-X6000加速卡已开始与软件企业 AI应用企业 互联网厂商等多个客户进行研发对接 生态融合并开始商业化应用[1] - 公司以NPU为核心 将推出GPNPU架构 走“推理优先架构”路线 在矩阵/向量单元 存储层级和带宽利用上深度优化 目标是实现推理效率百倍级提升[1] - 公司计划在四代NPU基础上研发第五代GPNPU架构 核心路径是融合GPU通用性与NPU高能效 以“算力积木”设计和3D堆叠存储为核心创新[2] 公司商业合作与生态建设 - 2025年11月 公司与金蝶软件达成战略合作 双方共同打造“国产算力引擎+企业级软件生态”的融合标杆 推动公司AI推理能力嵌入更广泛的企业数字化流程[1] 行业趋势与公司战略定位 - “推理异构化”已成为行业趋势[2] - 公司第五代GPNPU架构聚焦提升资本开支Token转化率与运营开支Token转化率 通过全栈协同优化 为大模型组合应用与复合智能体部署提供核心算力支撑 目标是实现“百万Token的极致性价比”[2]
云天励飞陈宁对话Hinton:推理时代来临 GPNPU架构如何破局?
证券日报· 2025-12-03 14:41
行业趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,未来需探索模拟计算、类脑芯片及基于类器官的计算等新形态[3] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,推理/处理芯片有望达到4万亿美元,占比约80%[3] - 2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段[5] 技术发展路径 - 未来AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备中,实现无处不在的按需取用[3] - “推理异构化”成为行业趋势,单一芯片难以兼顾AI任务中高算力的需求理解阶段与高带宽的答案生成阶段[6] - 行业核心竞争力将聚焦于芯片架构的灵活适配能力,以应对多模型混合应用的常态[6] 公司战略与创新 - 公司以NPU为核心,推出GPNPU架构,走“推理优先架构”路线,目标实现推理效率百倍级提升[5] - 公司研发第五代GPNPU架构,核心是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新[6] - 公司致力于通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”[6] 公司竞争优势 - 公司自2005年参与并行计算指令集与芯片架构设计,掌握算法芯片化的第一性原理,可实现软硬结合的高性价比设计[7] - 公司沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才[7] - 公司地处粤港澳大湾区,可利用全球最完善的人工智能与机电一体化产业链,以及深圳的芯片设计、硬件制造、供应链与营销网络,以市场需求驱动研发[7] 行业生态与愿景 - 真正有意义的AI必须让更多人用得起、用得上,当AI使用成本接近水电气基础设施水平时,才能惠及偏远地区学生、基层医院和中小企业[4] - 公司呼吁建立全球统一的推理算力网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域[7]