TX81芯片
搜索文档
可重构芯片突围:清微智能RPU崛起,“后GPU”算力谁主沉浮
环球网· 2026-01-14 13:28
AI芯片技术格局演变 - 2026年初,AI芯片战场正悄然转向,三大技术流派成形:GPU派、ASIC派与可重构数据流派[4] - GPU派以英伟达为代表,是当前AI芯片领域的绝对霸主,但其性能提升受制于“内存墙”、高功耗等问题[4] - ASIC派以谷歌TPU为代表,通过硬件与算法深度绑定实现极致能效,但存在算法迭代后硬件难匹配的风险[4] - 可重构数据流派以Groq的LPU和清微智能的RPU为代表,核心是“软件定义硬件”,兼具ASIC高效能与GPU灵活性[4] 行业领导者动态与竞争 - 英伟达在CES上发布Rubin平台,宣称推理成本降至十分之一,但面临战略焦虑[1] - Meta被曝考虑弃用英伟达GPU、转投谷歌TPU[1] - 2025年圣诞节,英伟达以200亿美元闪电收购估值仅69亿美元的初创公司Groq,溢价近3倍[1] - Groq的核心武器是其LPU,在大模型推理中性能可达GPU的5–18倍,能效比提升10倍[1] 可重构芯片技术优势与案例 - 可重构芯片(如LPU/RPU)绕过传统GPU的内存墙,实现几乎“确定性延迟”的Token吞吐[1] - 清微智能的旗舰芯片TX81支持万亿参数大模型的训推一体[2] - 搭载TX81芯片的REX1032服务器可高效运行DeepSeekR1/V3等主流大模型,推理成本降低50%,能效比提升3倍[2][5] - 该技术路线正从细分走向主流,成为头部企业争相布局的核心方向[7] 中国关键玩家:清微智能 - 北京AI芯片公司清微智能自研的RPU与Groq的LPU同属可重构数据流架构,被业内称为“中国版高阶TPU”[2] - 2025年12月,公司完成超20亿元C轮融资[2] - 公司已实现从IP、芯片到服务器的全栈自研,并在全国部署超3万张AI加速卡,稳居国产第一梯队[2] - 清微RPU已落地国家“东数西算”工程,新疆双河市中树云智算中心全部采用其芯片构建[2] - 在生态层面,清微深度适配国产开源操作系统FlagOS,并与华为昇腾、寒武纪等共同组成“FlagOS卓越适配单位”[4] 市场定位与未来展望 - GPU派在训练和通用计算中保持核心地位[7] - ASIC派正用极致能效比主攻特定模型的推理场景,帮助云厂商降本增效[7] - 可重构数据流派以其灵活、高效、确定性,成为多元化AI芯片生态的重要力量[7] - 在这场决定下一代算力话语权的竞赛中,清微智能和它的RPU被视为中国打出的一张关键牌[7]
清微智能:以可重构架构为基,改写AI芯片新格局
新浪财经· 2026-01-12 15:25
行业核心观点 - AI芯片行业正经历技术路线的重大演变,从GPU主导转向GPU、ASIC和可重构数据流架构三大流派竞争的新格局 [4][14] - 可重构数据流架构(如LPU/RPU)凭借其灵活性、高效能和确定性,正从细分走向主流,成为头部企业和资本争相布局的核心方向 [4][6][16] - 行业预测显示,非GPU产品(ASIC和可重构)在中国AI加速卡市场的占比将从2025年上半年的约30%提升至2028年的接近50%,占据半壁江山 [19] 英伟达的战略行动与竞争压力 - 2025年圣诞节,英伟达以约200亿美元(约1400亿人民币)的价格,溢价近3倍收购了可重构数据流芯片公司Groq,收购金额约占其持有现金的三分之一 [2][13] - 收购Groq旨在获取其LPU(语言处理单元)技术,该技术采用软件定义硬件的可重构数据流架构,在处理大模型时能实现比GPU快5-18倍、能效比高10倍的突破 [2][13] - 此次收购的背景是竞争压力加剧,此前(2024年11月)Meta拟采用谷歌TPU的传闻导致英伟达市值一夜蒸发数千亿美元 [1][11] - 作为应对,英伟达发布了新一代芯片Rubin,其训练性能是Blackwell的3.5倍,AI软件运行性能提升5倍,推理成本降至前代的1/10 [1][11] 可重构数据流架构的技术优势与全球布局 - 可重构数据流架构(RPU/LPU)的核心是“软件定义硬件”,硬件资源可通过软件指令实时重组,兼具ASIC的高效能和GPU的灵活性 [4][15] - 该架构能实现Token“瞬时”且“准时”的吞吐,超越GPU和TPU的物理极限 [2][13] - 全球资本正不约而同押注该赛道:英特尔已与美国可重构AI芯片独角兽SambaNova签署收购意向书;中国的清微智能在2025年12月2日完成了超20亿元人民币的C轮融资 [3][14] - Groq由谷歌TPU之父创办,其LPU技术被称为“高阶TPU” [2][13] 2026年AI芯片三大技术流派格局 - **GPU派**:以英伟达、摩尔线程为代表,是当前霸主,但性能提升受制于半导体制程极限、HBM带宽提升困难以及“内存墙”、高功耗等问题 [4][15] - **ASIC派**:以谷歌TPU、寒武纪、百度昆仑芯为代表,是为特定算法深度定制的“特种兵路线”,能实现极致能效,但短板是算法迭代后硬件容易过时 [4][15] - **可重构数据流派**:以Groq的LPU、清微智能的RPU为代表,凭借灵活、高效、确定性的特点,成为多元化AI芯片生态的重要力量 [4][16] - 2026年格局定位:GPU在训练和通用计算保持核心地位;ASIC以极致能效比主攻特定模型推理,帮助云厂商降本增效;可重构数据流派则成为重要力量 [5][16] 中国可重构芯片领军企业——清微智能的发展 - **技术产品与性能**:量产的TX81芯片,一台搭载该芯片的AI训推一体服务器即可部署万亿参数大模型,其REX1032服务器单机支持大模型满血版推理,成本降低50%,能效比提升3倍 [5][16] - **项目落地与市场地位**:在新疆双河市部署了全疆首个基于可重构架构的绿色智算中心,算力卡订单总量已突破30000枚 [6][18];2025年上半年出货量已进入国内第一梯队,技术从“突破”进入“规模落地”阶段 [7][18] - **生态合作**:深度融入国产“众智FlagOS”开源生态,与寒武纪、昆仑芯、摩尔线程、华为昇腾、中科海光并列为国内唯六的“FlagOS卓越适配单位” [7][18] - **资本与战略地位**:获得国家集成电路产业投资基金(大基金二期)的独家新架构芯片企业投资;C轮融资引入京能集团、北创投、京国瑞等北京国资巨头 [9][19];与摩尔线程、昆仑芯、寒武纪共同被纳入北京AI芯片“四大金刚”矩阵,覆盖三大技术流派 [9][10][19] - **下一代技术**:瞄准3D可重构架构,力图将AI芯片有效带宽提升10倍,能效比提升数倍,实现对国际主流高端芯片的超越 [9][18]
AI算力竞赛白热化 清微智能可重构芯片开辟新赛道
新浪财经· 2026-01-11 20:04
行业技术趋势 - 英伟达发布新一代AI芯片Rubin,其训练性能是Blackwell的3.5倍,AI软件运行性能提升5倍,推理成本降至前代的1/10 [1] - AI芯片技术呈现三大流派竞争格局:GPU派(如英伟达)、ASIC派(如谷歌TPU)和可重构数据流派(如Groq的LPU)[6] - 可重构数据流架构(RPU/LPU)采用“软件定义硬件”设计,兼具ASIC的高效能与GPU的灵活性,能根据算法变化实时重组硬件资源 [6] - 在AI从训练转向推理的时代,可重构数据流架构因其灵活、高效和确定性,正从细分走向主流,成为头部企业争相布局的核心方向 [5][6][7] - 据IDC预测,到2028年,中国AI加速卡市场中非GPU产品(ASIC和可重构)的占比有望从2025年上半年的约30%提升至接近50% [13] 主要市场动态与竞争 - 谷歌TPU及可重构数据流架构的崛起,正在侵蚀英伟达的市场统治地位 [1] - 2025年圣诞节,英伟达以约200亿美元(约1400亿人民币)的现金收购了可重构数据流芯片公司Groq,收购溢价约为其三个月前69亿美元估值的3倍 [3] - Groq的LPU技术在处理大模型时能实现Token“瞬时”吞吐,性能比GPU快5-18倍,能效比高10倍,被称为“高阶TPU” [3] - 除英伟达外,英特尔也计划收购美国可重构AI芯片独角兽SambaNova,显示全球资本正押注可重构技术赛道 [5] - 中国芯片公司清微智能在2025年12月2日完成超20亿元人民币的C轮融资,其RPU技术与Groq的LPU同属可重构数据流路线 [5] 公司(清微智能)表现与战略 - 清微智能是可重构数据流(RPU)芯片的代表企业,其量产芯片TX81已应用于AI训推一体服务器,可支持万亿参数大模型部署 [7] - 搭载清微智能TX81芯片的REX1032训推一体服务器,单机支持DeepSeekR1/V3满血版推理,成本降低50%,能效比提升3倍 [7] - 公司已深度融入国产“众智FlagOS”开源生态,并与寒武纪、昆仑芯、摩尔线程、华为昇腾、中科海光共同成为国内唯六的“FlagOS卓越适配单位” [11] - 清微智能在全国多省市落地千卡级智算中心,算力卡订单总量已突破30000枚 [11] - 根据IDC数据,2025年上半年清微智能的出货量已进入国内第一梯队,标志着其技术已从“技术突破”跃升至“规模落地”阶段 [11] - 公司下一代芯片瞄准3D可重构架构,目标是将AI芯片有效带宽提升10倍,能效比提升数倍,以实现对国际高端AI芯片的超越 [11] - 清微智能获得了国家集成电路产业投资基金(大基金二期)的投资,是“大基金”唯一投资的新架构芯片企业,并在C轮融资中引入了京能集团、北创投、京国瑞等北京国资巨头 [12] - 公司已与摩尔线程、昆仑芯、寒武纪一同被纳入北京AI芯片矩阵的“四大金刚”,实现了对GPU、ASIC和可重构三大技术流派的全覆盖 [12][13] 具体应用与项目 - 在新疆双河市,基于清微智能可重构计算芯片部署的中树云智算中心已建成,这是全疆第一座基于该架构的绿色算力枢纽,服务于国家“东数西算”和“算力出海”战略 [8] - 清微智能发布的新一代超节点方案,凭借超越GPU和ASIC集群的高算力和高显存,成为可重构AI计算领域的“大国重器” [9]
融资20亿,科创板“非GPU”算力第一股来了!
新浪财经· 2025-12-03 21:21
融资与上市进展 - 公司完成超20亿元人民币C轮融资,由北京市属国企京能集团领投,近二十家机构跟投,老股东持续加码 [1] - 公司同步启动上市筹备,目标为科创板,立志成为国内“非GPU”新型架构芯片第一股 [1] - 此次C轮融资是公司上市前的最后一轮融资,七年累计完成7轮融资,引入百度、蚂蚁、SK海力士、商汤等战略股东 [12][24] 融资资金用途 - 本轮募资将聚焦于下一代可重构芯片核心技术迭代 [3][14] - 资金将用于智算中心场景规模化落地,公司已建成十余座千卡级集群 [3][14] - 部分资金将用于高端研发人才引进,以夯实“云-边-端”全栈团队 [3][14] 核心技术优势 - 公司核心技术为动态可重构计算架构(CGRA),被ITRS誉为“最具前景的第四类通用芯片” [5][16] - 最新量产芯片TX81单机算力达4 PFLOPS,成本较GPU方案降低50%,能效提升3倍,已适配DeepSeek、Qwen等主流大模型 [3][14] - CGRA架构能效比逼近ASIC,运行功耗可低至0.7 mW/核,在传感器AI任务上较先进超低功耗CPU能效提升41倍,速度提高4.4倍 [5][16] - 架构支持纳秒级(10–100 ns)动态重构,硬件利用率超过90%,实现一颗芯片替代多颗专用芯片 [7][16] - 采用原生数据流驱动,95%数据在阵列内部循环,内存带宽需求仅为GPU的1/10至1/30 [9][18] - TX8系列支持无交换机千卡集群互联,TCO较GPU方案下降50%,已在北京、成都等地部署十余座千卡集群 [9][18] 商业化与市场地位 - 公司提供CUDA-like API与主流框架插件,90%开源模型无需手工调优,可实现软件栈零成本迁移 [20][21] - 从2019年至2025年,公司累计芯片出货量超过500万颗,覆盖可穿戴、安防、5G基站、智算中心四大场景 [11][22] - 据IDC统计,2025年上半年公司AI加速卡出货量位列国产第六,IDC已单独列出“CGRA”新品类 [11][23] - 公司是全球CGRA出货量最大的企业,其技术为AIoT和智算中心提供了高算力、低功耗的第三极选择 [11][22] 市场定位与战略意义 - 公司在GPU垄断的AI算力市场中开辟了“非GPU”新赛道,本轮融资是国产新型算力尝试“换道超车”的试金石 [3][14] - 本轮融资获得“市级+区级”国资矩阵护航,包括京能集团、京国瑞、中关村科学城等,兼具算力资源协同与政策加持 [11][23]
AI芯片企业清微智能超20亿元C轮融资,即将冲击IPO
机器人圈· 2025-12-03 17:56
融资与上市进展 - 公司完成超20亿元人民币C轮融资 由京能集团领投 多家机构跟投及老股东持续追投 [1] - 融资资金将重点投向下一代可重构芯片研发 智算场景落地 高端人才引进 [1] - 公司已启动上市筹备工作 目标成为国内非GPU新型架构芯片领域首个上市标杆企业 [1][2] 公司技术与产品概况 - 公司是可重构计算芯片领导企业 核心技术团队来自清华大学微电子所 从事芯片研发13年 曾获国家技术发明奖和中国专利金奖 [2] - 公司芯片产品于2019年上半年量产 预计出货量近千万颗 [2] - 可重构AI芯片已在全国十余座千卡规模智算中心落地 2025年算力卡订单累计超2万张 可重构芯片总出货量超3000万颗 [2] 产品系列与技术优势 - TX5系列面向边缘智能场景 覆盖图像及视频 具有灵活 低功耗 高效能优势 [4] - TX8系列面向云端市场 基于可重构数据流架构 支持芯片及系统间直接互联 无需交换机 [7] - 最新TX81单个RPU模组算力达512TFLOPS(FP16) REX1032训推一体服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 可实现千卡直接互联 [7] 生态合作与行业地位 - 公司与北京智源人工智能研究院共建联合实验室 深度参与开源社区建设 [8] - 公司成为FlagOS卓越适配单位 与寒武纪 摩尔线程 昆仑芯等共同跻身国产芯片软件生态共建领军梯队 [8] - 公司携手AI创新机构成立北京市可重构算力软硬件协同技术创新中心 致力于产学研用深度融合 [10]
ICCAD2025:中国芯片设计产值预测首超千亿美元,清微智能CEO王博获年度企业家
搜狐财经· 2025-11-28 10:11
行业整体趋势 - 2025年中国芯片设计销售额有望首次超过1000亿美元,重回高速增长区间 [1] - 行业专家预测,在AI等新技术推动下,中国芯片设计产业规模有望在2030年前达到或超过1万亿元 [3] - 2025年ICCAD-Expo汇聚了2000余家国内外企业和逾6300位行业专家 [3] 非GPU/AI芯片市场动态 - 截至2025年上半年,中国非GPU服务器市场占比达到30%,预计到2028年将增长至50% [3] - 国产非GPU芯片架构展现出强劲增长潜力,AI软件生态开始主动拥抱硬件创新 [5] - DeepSeek发布的v3.1大模型基于新一代国产芯片架构完成训练与推理,标志生态转变 [5] 可重构计算技术发展 - 可重构计算架构被视为国产AI芯片“换道超车”的战略机遇 [5] - 清微智能提出覆盖“云-边-端”场景的全栈式解决方案,通过三代芯片持续演进构建技术优势 [5] - 公司以C2C算力网格技术为核心,构建高带宽、低延迟数据流通路 [6] 清微智能公司进展 - 公司CEO王博荣获2025年度唯一“IC设计业年度企业家”称号,表彰其在新型架构AI芯片国产化的推动 [1][6] - 大规模量产的TX81芯片支持万亿参数大模型部署,解决方案成本相比同行业降低50%,能效比提升3倍 [6] - 自产品量产以来,已在多地布局千卡规模智算集群,累计可重构算力卡订单超20000张 [7] - 2025年上半年,公司在国内主要可商用AI加速卡出货量排行中位列第六,跻身国产算力第一梯队 [7] 行业盛会与认可 - ICCAD-Expo已成为中国集成电路设计业顶级盛会,今年举办第31届 [3] - IC设计年度企业家奖项自2012年设立至今仅有9位企业家获选,入围资格严苛 [10]
聚焦“新算力”,清微智能新架构助力AI科技“换道超车”
经济网· 2025-09-18 17:15
文章核心观点 - 全球AI芯片行业正经历架构迭代,数据流架构成为新兴技术路径,有望突破传统GPU瓶颈 [1][2] - 清微智能作为国内领先企业,通过数据流可重构芯片技术实现“换道超车”,其产品已实现规模化落地 [1][2] - 产业资本和政策支持加速“国产新算力”发展,市场风向显示行业向数据流架构转变的关键信号 [3] 海外AI芯片市场动态 - 2023年全球独角兽榜单中,芯片公司SambaNova估值5年内飙升至50亿美元,Groq获6亿美元融资后估值翻倍至60亿美元 [1] - 海外初创或后发AI芯片公司大多采用新兴的数据流架构技术,而非传统GPU架构 [1] - 芯片架构存在“类摩尔定律”,约20年一迭代,当前正从GPU架构向新一代架构转变 [1] 数据流架构技术定位 - 数据流芯片被行业称为“新算力”或“新GPU”,国际半导体路线图将其定义为新一代芯片架构 [2] - 2017年计算机图灵奖获得者大卫·帕特森认为,计算机架构领域将迎来新的黄金十年 [2] - 该技术从原理上突破传统GPU架构瓶颈,不依赖先进存储和芯片制程,性价比显著提升 [2] 清微智能技术与产品 - 公司源于清华大学,具有近20年技术积累,在全球领先完成数据流可重构芯片技术的工程化和量产落地 [1] - 选择“换道超车”技术路线,旨在实现“高阶国产替代”,不依赖传统技术路径 [2] - 首款“新算力”芯片“TX81”推出半年内,即在全国多地落地千卡智算中心,累计订单超过20000枚 [2] 行业支持与市场信号 - 各级投资机构如大基金投资、国开基金纷纷入场投资,看到新算力的价值 [3] - ChatGPT宣布转向数据流架构,DeepSeek3.1宣布支持包括清微智能在内的下一代国产芯片 [3] - 新技术规模化落地需要充足的研发时间、技术迭代、资本注入及政策扶持 [3]
英伟达学徒遍地,他偏要另起炉灶
虎嗅APP· 2025-08-15 21:56
核心观点 - 可重构芯片技术正在挑战英伟达主导的GPU架构,成为AI算力芯片领域的潜在颠覆者 [5][6][20] - 清微智能通过动态配置计算单元的可重构架构,实现比传统GPU更高的灵活性和能效比 [6][7][24] - 公司采取"5倍性价比"战略,通过架构创新和3D存储技术突破英伟达生态壁垒 [18][19][31] 技术架构 - 可重构芯片采用无指令配置+数据流驱动范式,区别于GPU的指令驱动+共享存储模式 [7] - 动态重构能力使计算单元连接可像铁路道岔般切换,单次重构仅需十几纳秒 [23][24] - 架构天然适配3D堆叠技术,计算单元与存储的立体布局突破传统二维平面限制 [31] 商业化路径 - 从边缘端芯片切入,2022年推出云端TX8系列,半年内实现20000枚订单 [15] - TX81芯片支持千卡直连,单服务器算力达4 PFLOPS,节省交换机成本 [17][30] - 初期在消费电子领域试错后,聚焦AI算力占比超50%的高价值场景 [14][15] 竞争策略 - 通过三层兼容方案(CUDA API/Triton编译器/RISC-V指令集)降低用户迁移成本 [32][33] - 4000卡规模下无需交换机+HBM存储,采用DDR方案降低30%硬件成本 [30] - 下一代产品将3D存储能效提升5倍,预计2025年下半年交付 [19][31] 行业趋势 - 谷歌TPU/Groq/SambaNova等企业已形成GPU之外的"第二阵营" [20][34] - 2017-2025年全球可重构芯片市场规模年复合增长率预计达67% [20][25] - 摩尔定律放缓背景下,新架构芯片在AI算力需求驱动下加速渗透 [10][26]
英伟达学徒遍地,他偏要另起炉灶
虎嗅· 2025-08-15 17:21
公司技术路线 - 采用可重构芯片架构 与英伟达GPU的指令驱动+共享存储范式不同 属于无指令配置+数据流驱动架构 [2][3] - 通过动态配置计算单元实现多功能任务转换 类比铁路道岔切换机制 [2] - 脱离传统冯诺依曼架构 计算过程无需取指译码 直接通过通信接口实现芯片间数据传输 [3][5] 产品发展历程 - 2018年成立公司 2019年推出首枚量产可重构芯片(智能手机语音唤醒芯片) [6][9] - 2022年初立项云端TX8系列芯片 2023年底首枚AI算力芯片TX81开始批量出货 [11] - TX81芯片累计订单超20000枚 半年内实现全国多地千卡智算中心落地 [11] 性能与成本优势 - TX81芯片打造的REX1032服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 [14] - 千卡直接互联无需交换机 采用DDR存储替代昂贵HBM存储 [14][25] - 下一代产品将应用3D存储技术 预计2026年下半年交付 [15][27] 市场竞争策略 - 要求产品具备5倍性价比优势(性能更优+成本更低)以应对生态劣势 [14][24] - 通过三层兼容方案对接生态:CUDA API兼容/Triton编译器兼容/RISC-V指令集兼容 [28][29] - 与谷歌TPU/Groq/SambaNova等同属可重构数据流新架构阵营 形成第二技术阵营 [16][30] 技术差异化 - 动态可重构特性:程序运行中每十几纳秒重构一次计算单元连接方式 [19][20] - 与FPGA重构门电路不同 重点重构计算单元之间的连接通路 [19] - 3D存储技术与可重构架构具备天然适配性 突破传统二维平面布局限制 [26]
这颗芯片点亮那一晚,中国工程师集体泪崩!
新浪财经· 2025-06-23 23:28
行业趋势与技术创新 - 摩尔定律面临物理极限,传统芯片算力增长难以满足AI爆炸式需求,架构创新成为破局关键[5] - 动态可重构芯片(RPU)通过无指令集直接计算和动态匹配计算单元实现高能效、高并发、高扩展性、高性价比四大优势[7][8] - 中国算力芯片采取"高阶国产替代"路径,从底层原创突破技术壁垒,类比电动车产业换道超车模式[9][14] 公司技术与产品 - TX81芯片采用800平方毫米极限尺寸裸片,结合C2C网格直连技术消除数据中转,提升算力利用率[35][36] - 全球首款规模化量产的可重构云端算力芯片,2025年已部署多个千卡集群算力中心[51] - 第二代TX82芯片研发中,计划2026年流片,持续强化自主可控技术路线[53] 创业历程与团队 - 创始人王博基于清华大学THINKER芯片技术,2018年联合尹首一教授创立清微智能,转型学术成果产业化[17][18][22] - 初创团队仅20余人,蜗居30平米办公室,自建研发流程与质量标准,完成全原创代码开发[29][32] - 核心成员包括华为、阿里背景的技术专家,攻克时钟器件定制等关键难题,承受千万美元级流片风险[39][40][41] 市场竞争与战略定位 - 避开GPU主导的存量市场,以可重构架构开辟AI算力新赛道,打破海外技术生态壁垒[28][49] - 与清华系企业智谱形成"AI原创双子星"协同,覆盖芯片与大模型软硬件全栈技术[53] - 复制中国电动车产业逆袭路径,通过原创技术+产业链整合实现高阶国产替代[12][14] 技术突破里程碑 - 首次流片遭遇电源匹配故障,经通宵调试后成功点亮芯片,标志架构可行性验证[42][43][44] - 独创3D存储堆叠等技术组合拳,解决多卡互联编程难题,释放澎湃算力[14][36] - 六年研发周期远超传统芯片12-18个月迭代节奏,体现原创技术攻坚难度[41][51]