训练芯片
搜索文档
微软投资AI芯片公司,挑战英伟达
半导体行业观察· 2026-02-14 09:37
文章核心观点 - 人工智能芯片行业正从以训练为中心转向以推理为中心,推理阶段的效率、成本和延迟成为新的竞争焦点 [2][3] - 以d-Matrix为代表的初创公司正通过设计专用推理芯片,挑战英伟达在AI芯片市场的统治地位,其核心优势在于通过架构创新实现更低的延迟和更高的能效 [2][5][7] 行业趋势:从训练到推理的转变 - 人工智能工作负载的重心正从模型训练转向模型推理,推理关乎效率,而训练关乎表现 [2][3] - 推理不仅是一个计算问题,更是一个计算与内存的综合问题,内存访问速度是影响延迟的关键因素 [3][4] - 当前大部分基础设施针对训练优化,优先峰值性能,而推理(尤其是交互式AI)更看重平均响应速度和低延迟 [4] d-Matrix的技术与产品策略 - 公司核心理念是制造能提供更快、更便宜、更高效率推理的芯片,旨在改变AI竞争格局 [2] - 其解决方案的核心架构创新在于将计算和内存紧密融合,缩短数据移动距离,并采用模块化的芯片组设计,以优化推理数据流、降低延迟并提高每瓦每秒令牌数 [5] - 公司声称其芯片在运行推理操作时,成本比GPU降低约90%,且能效(每瓦浮点运算次数)显著更高 [5] - 公司已开始小批量出货(几百颗),预计很快达到数千颗,并计划在今年实现数百万颗的大规模量产 [6] 市场竞争格局与挑战者涌现 - 英伟达目前是AI芯片市场无可争议的冠军,市值达4.5万亿美元,其GPU主导训练和推理市场 [7] - 但市场对替代方案的兴趣日益增长,客户开始寻求对冲或获取更多芯片的途径,投资者和初创公司尤其看到了推理领域的市场机会 [7][8] - 近期行业出现多笔重大交易与融资,显示竞争加剧:Groq被收购(交易额据报达200亿美元)、Cerebras与OpenAI签署价值100亿美元的芯片供应协议、Anthropic签署非英伟达芯片协议、Etched融资约5亿美元、d-Matrix于去年11月融资2.75亿美元 [8][9] - 中国开源推理模型DeepSeek的出现也助推了市场对快速推理芯片的兴趣 [9] - 尽管英伟达实力强大并承诺每年更新芯片,但行业开始出现裂痕,专用推理硬件被视为行业发展到一定阶段的必然产物 [10] 其他主要参与者的动态 - OpenAI已开始使用Cerebras的巨型芯片运行其GPT-5.3-Codex-Spark编码模型的推理,据报道速度比其他架构提升15到20倍 [5] - 大型科技公司也在开发自有芯片:微软发布了第二代AI芯片Maia,并支持d-Matrix;亚马逊和谷歌也拥有自研芯片(如Trainium、TPU),但它们仍大量使用英伟达GPU [9][10] - 行业观点认为,未来市场可能不会只有一个赢家,专用硬件将随着AI应用的工程化发展而兴起 [7][10]
专访云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道· 2025-12-31 06:49
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更具长期价值的AI推理芯片赛道[1] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,与全球及中国AI行业发展阶段同步[3] - 在算力驱动阶段,公司并未盲目追随GPU路线或贸然切入训练芯片赛道,而是坚持立足自身技术积累和产业定位的发展道路[4] 行业周期与趋势 - 全球人工智能行业经历了三个周期:2012-2020年的智能感知时代、2020-2024年的大模型时代、以及当前开启的算力驱动阶段[3] - 训练时代由英伟达主导,但在推理时代,所有参与者站在新的起跑线上,成本、效率和系统能力成为建立优势的关键[1] - 推理已进入算力中心舞台,未来将构建更繁荣的推理芯片和应用生态,硬件架构可能呈现更多异构组合[1] - AI新时代帷幕已拉开,格局未定,芯片厂商正围绕算力、架构与成本进行长期竞赛并不断加速[2] 市场机会与规模 - 中国在AI发展上更多是应用驱动,强项在于将技术快速转化为规模化、可落地的应用[5] - 中国策略重点在于鼓励大规模市场化应用,加速AI在各行各业渗透,而高效运行的推理芯片是亟待补齐的关键环节[6] - 训练芯片市场规模远无法与推理芯片相比,到2030年,全球训练芯片市场规模可能达约1万亿美元,而推理芯片市场至少将达4万亿美元甚至更高[7] - 英伟达收购专注于AI推理芯片的Groq,强化了推理基础设施加速演进的行业信号[8] 发展挑战 - 推理芯片研发和市场推进的挑战包括硬件本身的复杂性,芯片从设计、流片到量产是高投入、长周期的过程[9] - 软件生态构建是另一大挑战,需投入大量资源打造完整软件栈以充分发挥硬件性能[10] - AI技术快速演进,大模型架构、计算范式等持续变化,而芯片设计和制造周期长达一到两年,要求芯片架构必须具备足够的前瞻性与灵活性[10]
云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道· 2025-12-27 23:15
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更具长期价值的AI推理芯片赛道[4] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[7] - 公司并未盲目追随GPU路线或切入训练芯片赛道,而是立足自身技术积累和产业定位,坚持符合自身节奏的发展道路[8] - 公司通过端到端的应用闭环来验证芯片的实际价值,构建了覆盖应用、算法与芯片的全栈能力[6] - 公司营收结构变化与AI行业发展阶段匹配,早期以行业解决方案为主,大模型阶段出现标品和服务,未来推理算力市场爆发将带动推理芯片出货量增长拐点[18][19] 行业趋势与市场判断 - AI推理芯片时代正在形成市场共识,推理已进入算力的中心舞台,未来AI场上将迎来更繁荣的推理芯片和应用生态[4][5] - 到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[12] - 2025年将是重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化,形成独立的技术路径和产品体系[13] - AI推理的普及正在开启一个全新时代,AI正从实验室技术转变为嵌入生活和产业环节的基础设施,用户行为在2025年真正成型[13] - 中国AI发展模式是应用驱动,强调技术落地到产业场景,国家政策推动到2027年新一代智能终端、智能体等应用普及率超70%,到2030年超90%[9] - 中国的策略是在大模型基本追平后,重点鼓励大规模市场化应用,加速AI在各行各业渗透,而高效运行的推理芯片是亟需补齐的关键环节[10] - 半导体市场的并购活动将越来越多,原因是AI应用和AI推理两大生态快速崛起催生大量新机会[25] 技术路径与产品进展 - 公司最新提出GPNPU架构,可理解为中国版TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[14] - GPNPU架构融合了三方面核心优势:借鉴GPU的可编程性与生态兼容性、继承NPU在推理任务中的高能效优势、深度融合存算一体技术[14] - 存算一体技术是中国AI芯片实现差异化突破的重要机遇,是在先进制程工艺受限条件下构建自主可控技术体系的关键路径[14] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,同时保持价格优势[14] - 芯片设计是在性能、功耗、面积与成本之间不断权衡与优化的过程,团队拥有近20年的芯片架构设计经验,长期坚持“算法芯片化”理念[14] - 推理芯片研发面临硬件复杂性、软件生态构建以及AI技术快速演进等多方面挑战[23][24] 客户与市场机会 - 推理芯片的终极目标客户是互联网大厂,其每年的采购额达上千亿,成为其第三、第四供应商意味着几十亿、上百亿的订单规模[17] - 当前芯片订单需求最明确的来自互联网头部大厂,第二梯队包括三大通信运营商及部分中大型互联网企业,第三类是AI领域的创业公司[15] - 互联网大厂通常会采用多家供应商策略,一方面是保障供应链安全,另一方面是产品线需求不同[16] - 中国在训练芯片领域与国际存在差距,但真正的机会和主战场在推理芯片赛道,这里市场空间更大,更契合中国应用驱动的发展优势[12] 区域产业环境 - 广东省对集成电路产业高度重视,明确提出应用场景开放驱动AI与集成电路产业发展的战略思路,这在全国具有前瞻性[26] - 粤港澳大湾区被英伟达CEO称为“全球唯一一个AI与机电一体化深度融合的区域”,其核心竞争力是AI原生硬件的策源地[26] - 依托庞大的终端市场,广东已形成涵盖“端、边、云”等多元场景的完整应用生态,以实际应用为牵引,拉动芯片的强劲需求[27] - 深圳是AI产品经理的摇篮,能敏锐捕捉真实需求并做出务实、可落地的AI硬件产品,因此在AI硬件新阶段持续领跑[28] - 深圳的产业政策聚焦,早在五六年前就明确提出要发展NPU芯片产业,长期稳定的政策支持使企业能坚持深耕技术研发[27]
21专访|云天励飞董事长陈宁:打造“中国版TPU”
21世纪经济报道· 2025-12-27 22:40
公司战略与定位 - 云天励飞已从AI解决方案提供商转向更底层、更具长期价值的AI推理芯片赛道[1] - 公司战略方向始终未变,但市场策略与时俱进,经历了三个发展周期,分别对应全球AI行业的智能感知时代、大模型时代和算力驱动阶段[4] - 公司坚持做芯片,并通过端到端的应用闭环来验证芯片的实际价值,已构建覆盖应用、算法与芯片的全栈能力[3] - 公司并未盲目追随GPU路线,尤其没有贸然切入训练芯片赛道,而是立足自身技术积累和产业定位[4] - 公司营收结构变化与AI行业发展阶段匹配,早期以行业解决方案为主,大模型阶段出现标品和服务,接下来推理算力市场将爆发,推理芯片出货量迎来增长拐点[16] 市场观点与行业趋势 - AI推理芯片时代正在形成市场共识,这是一个罕见的历史窗口期[1] - 在AI推理时代,所有厂商站在新的起跑线上,谁能在成本、效率和系统能力上建立优势,谁就有机会[2] - 未来硬件架构可能有更多异构组合,包括通用计算CPU、训练GPU和专门做推理的推理芯片[2] - 2025年将是重大转折点,训练与推理开始真正分离,推理走向专业化、高效化和场景化[8][9][10] - 大模型使用已从技术圈扩展到普通大众,用户行为的转变在2025年真正成型,类似于2007年iPhone发布后的智能机拐点[10] - 到2030年,全球训练芯片市场规模可能达到约1万亿美元,而推理芯片市场至少将达到4万亿美元,甚至更高[8] - 英伟达收购AI推理芯片公司Groq,进一步强化了推理基础设施加速演进的行业信号[8] - AI应用和AI推理两大生态正在快速崛起,催生大量新机会,半导体市场的并购活动将越来越多[21][22] 技术路径与产品 - 云天励飞最新提出GPNPU架构,可理解为中国版的TPU,相较于GPGPU,在推理效率与成本控制上能够实现数个数量级的优化[11] - GPNPU架构融合三方面核心优势:借鉴GPU的可编程性与生态兼容性、继承NPU在推理任务中的高能效优势、深度融合存算一体技术[11] - 团队拥有近20年芯片架构设计经验,坚持“算法芯片化”理念[11] - 存算一体技术是中国AI芯片实现差异化突破的重要机遇,是在先进制程工艺受限条件下构建自主可控技术体系的关键路径[11][18] - 基于GPNPU架构的Nova500芯片预计将在明年流片,目标是在推理赛道上性能对标全球头部企业,价格具有一定优势[12][13] - 芯片设计是在性能、功耗、面积与成本之间不断权衡与优化的过程[11] 客户与市场机会 - 当前芯片订单需求最明确的来自互联网头部大厂,第二梯队包括三大通信运营商及部分中大型互联网企业,第三类客户是AI领域的创业公司[14] - 互联网大厂是推理芯片的终极目标客户,其每年的采购额达上千亿,只要做到第三、第四供应商,都是几十亿、上百亿的订单规模[15] - 互联网大厂通常会采用多家供应商的策略,一方面是保障供应链安全,另一方面是产品线需求不同[15] - 中国的策略是在大模型上基本追平、进入全球第一梯队后,重点鼓励大规模市场化应用,加速AI在各行各业的渗透,而高效运行的推理芯片是亟需补齐的关键环节[5][6] - 中国真正的机会和主战场在推理芯片赛道,这里市场空间更大,也更契合中国以应用驱动、产业落地见长的发展优势[8] 发展环境与区域优势 - 中国AI发展模式更多是应用驱动,强调将技术落地到产业场景中,这与美国更偏向“从0到1”理论驱动的模式存在差异[5] - 国家政策《关于深入实施“人工智能+”行动的意见》明确提出:到2027年,新一代智能终端、智能体等应用普及率超70%;到2030年,普及率超90%,这是全球首个由国家层面明确推动AI规模化落地的战略[5] - 广东省对集成电路产业高度重视,明确提出应用场景开放驱动AI与集成电路产业发展的战略思路[23] - 粤港澳大湾区被英伟达CEO黄仁勋称为“全球唯一一个AI与机电一体化深度融合的区域”,广东的核心竞争力在于不仅是AI算法和软件的试验场,更是AI原生硬件的策源地[23] - 深圳产业政策聚焦,早在五六年前就明确提出要发展NPU芯片产业,这种长期稳定的政策支持使企业能坚持深耕[24] - 深圳堪称AI产品经理的摇篮,孕育出大量AI硬件创业公司,其成功源于对市场、用户和产业土壤的深刻理解,以及务实、可落地的产品思维[25]