REX1032训推一体服务器
搜索文档
可重构芯片突围:清微智能RPU崛起,“后GPU”算力谁主沉浮
环球网· 2026-01-14 13:28
AI芯片技术格局演变 - 2026年初,AI芯片战场正悄然转向,三大技术流派成形:GPU派、ASIC派与可重构数据流派[4] - GPU派以英伟达为代表,是当前AI芯片领域的绝对霸主,但其性能提升受制于“内存墙”、高功耗等问题[4] - ASIC派以谷歌TPU为代表,通过硬件与算法深度绑定实现极致能效,但存在算法迭代后硬件难匹配的风险[4] - 可重构数据流派以Groq的LPU和清微智能的RPU为代表,核心是“软件定义硬件”,兼具ASIC高效能与GPU灵活性[4] 行业领导者动态与竞争 - 英伟达在CES上发布Rubin平台,宣称推理成本降至十分之一,但面临战略焦虑[1] - Meta被曝考虑弃用英伟达GPU、转投谷歌TPU[1] - 2025年圣诞节,英伟达以200亿美元闪电收购估值仅69亿美元的初创公司Groq,溢价近3倍[1] - Groq的核心武器是其LPU,在大模型推理中性能可达GPU的5–18倍,能效比提升10倍[1] 可重构芯片技术优势与案例 - 可重构芯片(如LPU/RPU)绕过传统GPU的内存墙,实现几乎“确定性延迟”的Token吞吐[1] - 清微智能的旗舰芯片TX81支持万亿参数大模型的训推一体[2] - 搭载TX81芯片的REX1032服务器可高效运行DeepSeekR1/V3等主流大模型,推理成本降低50%,能效比提升3倍[2][5] - 该技术路线正从细分走向主流,成为头部企业争相布局的核心方向[7] 中国关键玩家:清微智能 - 北京AI芯片公司清微智能自研的RPU与Groq的LPU同属可重构数据流架构,被业内称为“中国版高阶TPU”[2] - 2025年12月,公司完成超20亿元C轮融资[2] - 公司已实现从IP、芯片到服务器的全栈自研,并在全国部署超3万张AI加速卡,稳居国产第一梯队[2] - 清微RPU已落地国家“东数西算”工程,新疆双河市中树云智算中心全部采用其芯片构建[2] - 在生态层面,清微深度适配国产开源操作系统FlagOS,并与华为昇腾、寒武纪等共同组成“FlagOS卓越适配单位”[4] 市场定位与未来展望 - GPU派在训练和通用计算中保持核心地位[7] - ASIC派正用极致能效比主攻特定模型的推理场景,帮助云厂商降本增效[7] - 可重构数据流派以其灵活、高效、确定性,成为多元化AI芯片生态的重要力量[7] - 在这场决定下一代算力话语权的竞赛中,清微智能和它的RPU被视为中国打出的一张关键牌[7]
清微智能:以可重构架构为基,改写AI芯片新格局
新浪财经· 2026-01-12 15:25
行业核心观点 - AI芯片行业正经历技术路线的重大演变,从GPU主导转向GPU、ASIC和可重构数据流架构三大流派竞争的新格局 [4][14] - 可重构数据流架构(如LPU/RPU)凭借其灵活性、高效能和确定性,正从细分走向主流,成为头部企业和资本争相布局的核心方向 [4][6][16] - 行业预测显示,非GPU产品(ASIC和可重构)在中国AI加速卡市场的占比将从2025年上半年的约30%提升至2028年的接近50%,占据半壁江山 [19] 英伟达的战略行动与竞争压力 - 2025年圣诞节,英伟达以约200亿美元(约1400亿人民币)的价格,溢价近3倍收购了可重构数据流芯片公司Groq,收购金额约占其持有现金的三分之一 [2][13] - 收购Groq旨在获取其LPU(语言处理单元)技术,该技术采用软件定义硬件的可重构数据流架构,在处理大模型时能实现比GPU快5-18倍、能效比高10倍的突破 [2][13] - 此次收购的背景是竞争压力加剧,此前(2024年11月)Meta拟采用谷歌TPU的传闻导致英伟达市值一夜蒸发数千亿美元 [1][11] - 作为应对,英伟达发布了新一代芯片Rubin,其训练性能是Blackwell的3.5倍,AI软件运行性能提升5倍,推理成本降至前代的1/10 [1][11] 可重构数据流架构的技术优势与全球布局 - 可重构数据流架构(RPU/LPU)的核心是“软件定义硬件”,硬件资源可通过软件指令实时重组,兼具ASIC的高效能和GPU的灵活性 [4][15] - 该架构能实现Token“瞬时”且“准时”的吞吐,超越GPU和TPU的物理极限 [2][13] - 全球资本正不约而同押注该赛道:英特尔已与美国可重构AI芯片独角兽SambaNova签署收购意向书;中国的清微智能在2025年12月2日完成了超20亿元人民币的C轮融资 [3][14] - Groq由谷歌TPU之父创办,其LPU技术被称为“高阶TPU” [2][13] 2026年AI芯片三大技术流派格局 - **GPU派**:以英伟达、摩尔线程为代表,是当前霸主,但性能提升受制于半导体制程极限、HBM带宽提升困难以及“内存墙”、高功耗等问题 [4][15] - **ASIC派**:以谷歌TPU、寒武纪、百度昆仑芯为代表,是为特定算法深度定制的“特种兵路线”,能实现极致能效,但短板是算法迭代后硬件容易过时 [4][15] - **可重构数据流派**:以Groq的LPU、清微智能的RPU为代表,凭借灵活、高效、确定性的特点,成为多元化AI芯片生态的重要力量 [4][16] - 2026年格局定位:GPU在训练和通用计算保持核心地位;ASIC以极致能效比主攻特定模型推理,帮助云厂商降本增效;可重构数据流派则成为重要力量 [5][16] 中国可重构芯片领军企业——清微智能的发展 - **技术产品与性能**:量产的TX81芯片,一台搭载该芯片的AI训推一体服务器即可部署万亿参数大模型,其REX1032服务器单机支持大模型满血版推理,成本降低50%,能效比提升3倍 [5][16] - **项目落地与市场地位**:在新疆双河市部署了全疆首个基于可重构架构的绿色智算中心,算力卡订单总量已突破30000枚 [6][18];2025年上半年出货量已进入国内第一梯队,技术从“突破”进入“规模落地”阶段 [7][18] - **生态合作**:深度融入国产“众智FlagOS”开源生态,与寒武纪、昆仑芯、摩尔线程、华为昇腾、中科海光并列为国内唯六的“FlagOS卓越适配单位” [7][18] - **资本与战略地位**:获得国家集成电路产业投资基金(大基金二期)的独家新架构芯片企业投资;C轮融资引入京能集团、北创投、京国瑞等北京国资巨头 [9][19];与摩尔线程、昆仑芯、寒武纪共同被纳入北京AI芯片“四大金刚”矩阵,覆盖三大技术流派 [9][10][19] - **下一代技术**:瞄准3D可重构架构,力图将AI芯片有效带宽提升10倍,能效比提升数倍,实现对国际主流高端芯片的超越 [9][18]
AI算力竞赛白热化 清微智能可重构芯片开辟新赛道
新浪财经· 2026-01-11 20:04
行业技术趋势 - 英伟达发布新一代AI芯片Rubin,其训练性能是Blackwell的3.5倍,AI软件运行性能提升5倍,推理成本降至前代的1/10 [1] - AI芯片技术呈现三大流派竞争格局:GPU派(如英伟达)、ASIC派(如谷歌TPU)和可重构数据流派(如Groq的LPU)[6] - 可重构数据流架构(RPU/LPU)采用“软件定义硬件”设计,兼具ASIC的高效能与GPU的灵活性,能根据算法变化实时重组硬件资源 [6] - 在AI从训练转向推理的时代,可重构数据流架构因其灵活、高效和确定性,正从细分走向主流,成为头部企业争相布局的核心方向 [5][6][7] - 据IDC预测,到2028年,中国AI加速卡市场中非GPU产品(ASIC和可重构)的占比有望从2025年上半年的约30%提升至接近50% [13] 主要市场动态与竞争 - 谷歌TPU及可重构数据流架构的崛起,正在侵蚀英伟达的市场统治地位 [1] - 2025年圣诞节,英伟达以约200亿美元(约1400亿人民币)的现金收购了可重构数据流芯片公司Groq,收购溢价约为其三个月前69亿美元估值的3倍 [3] - Groq的LPU技术在处理大模型时能实现Token“瞬时”吞吐,性能比GPU快5-18倍,能效比高10倍,被称为“高阶TPU” [3] - 除英伟达外,英特尔也计划收购美国可重构AI芯片独角兽SambaNova,显示全球资本正押注可重构技术赛道 [5] - 中国芯片公司清微智能在2025年12月2日完成超20亿元人民币的C轮融资,其RPU技术与Groq的LPU同属可重构数据流路线 [5] 公司(清微智能)表现与战略 - 清微智能是可重构数据流(RPU)芯片的代表企业,其量产芯片TX81已应用于AI训推一体服务器,可支持万亿参数大模型部署 [7] - 搭载清微智能TX81芯片的REX1032训推一体服务器,单机支持DeepSeekR1/V3满血版推理,成本降低50%,能效比提升3倍 [7] - 公司已深度融入国产“众智FlagOS”开源生态,并与寒武纪、昆仑芯、摩尔线程、华为昇腾、中科海光共同成为国内唯六的“FlagOS卓越适配单位” [11] - 清微智能在全国多省市落地千卡级智算中心,算力卡订单总量已突破30000枚 [11] - 根据IDC数据,2025年上半年清微智能的出货量已进入国内第一梯队,标志着其技术已从“技术突破”跃升至“规模落地”阶段 [11] - 公司下一代芯片瞄准3D可重构架构,目标是将AI芯片有效带宽提升10倍,能效比提升数倍,以实现对国际高端AI芯片的超越 [11] - 清微智能获得了国家集成电路产业投资基金(大基金二期)的投资,是“大基金”唯一投资的新架构芯片企业,并在C轮融资中引入了京能集团、北创投、京国瑞等北京国资巨头 [12] - 公司已与摩尔线程、昆仑芯、寒武纪一同被纳入北京AI芯片矩阵的“四大金刚”,实现了对GPU、ASIC和可重构三大技术流派的全覆盖 [12][13] 具体应用与项目 - 在新疆双河市,基于清微智能可重构计算芯片部署的中树云智算中心已建成,这是全疆第一座基于该架构的绿色算力枢纽,服务于国家“东数西算”和“算力出海”战略 [8] - 清微智能发布的新一代超节点方案,凭借超越GPU和ASIC集群的高算力和高显存,成为可重构AI计算领域的“大国重器” [9]
AI芯片企业清微智能超20亿元C轮融资,即将冲击IPO
机器人圈· 2025-12-03 17:56
融资与上市进展 - 公司完成超20亿元人民币C轮融资 由京能集团领投 多家机构跟投及老股东持续追投 [1] - 融资资金将重点投向下一代可重构芯片研发 智算场景落地 高端人才引进 [1] - 公司已启动上市筹备工作 目标成为国内非GPU新型架构芯片领域首个上市标杆企业 [1][2] 公司技术与产品概况 - 公司是可重构计算芯片领导企业 核心技术团队来自清华大学微电子所 从事芯片研发13年 曾获国家技术发明奖和中国专利金奖 [2] - 公司芯片产品于2019年上半年量产 预计出货量近千万颗 [2] - 可重构AI芯片已在全国十余座千卡规模智算中心落地 2025年算力卡订单累计超2万张 可重构芯片总出货量超3000万颗 [2] 产品系列与技术优势 - TX5系列面向边缘智能场景 覆盖图像及视频 具有灵活 低功耗 高效能优势 [4] - TX8系列面向云端市场 基于可重构数据流架构 支持芯片及系统间直接互联 无需交换机 [7] - 最新TX81单个RPU模组算力达512TFLOPS(FP16) REX1032训推一体服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 可实现千卡直接互联 [7] 生态合作与行业地位 - 公司与北京智源人工智能研究院共建联合实验室 深度参与开源社区建设 [8] - 公司成为FlagOS卓越适配单位 与寒武纪 摩尔线程 昆仑芯等共同跻身国产芯片软件生态共建领军梯队 [8] - 公司携手AI创新机构成立北京市可重构算力软硬件协同技术创新中心 致力于产学研用深度融合 [10]
清微智能获超20亿元融资 已启动上市筹备工作
巨潮资讯· 2025-12-02 22:15
公司融资与上市进展 - 清微智能于12月2日宣布完成超20亿元人民币C轮融资,并同步启动上市筹备工作 [1] - 公司计划以本轮融资为契机,在可重构计算这一“非GPU”新型架构赛道上冲刺首批上市标杆 [1] 投资方与资金用途 - 本轮融资由北京市属国企京能集团领投,北创投、建投投资、武岳峰科创、成都科创投等多家机构联合跟投,老股东京国瑞、中关村科学城公司、商汤国香资本等持续加码 [3] - 投资格局呈现“市级+区级”国资引领、产业资本与财务资本协同的特点 [3] - 募集资金将主要用于下一代可重构芯片核心技术研发、智算场景规模化落地以及高端技术人才引进与培养 [3] - 融资旨在强化公司在“云-边-端”全场景算力解决方案方面的综合竞争力 [3] 核心技术路径与产品性能 - 清微智能源自清华大学团队二十余年的技术积累,长期深耕可重构计算架构,走出一条区别于传统GPU的技术路径 [3] - 公司量产的TX81可重构AI芯片采用“C2C算力网格技术”,实现高带宽、低时延的数据流通 [3] - 搭载该芯片的REX1032训推一体服务器单机算力可达4 PFLOPS,支持万亿参数级大模型部署 [3] - 相较部分传统方案,该方案在成本和能效上分别可压降约50%、提升约3倍 [3] 商业化落地与市场地位 - 公司产品已适配DeepSeek、Qwen、商汤日日新等主流大模型 [3] - 已在浙江、北京、安徽等多地建设千卡规模智算集群 [3] - 累计可重构算力卡订单超过2万张 [3] - 根据行业统计数据,2025年上半年其在国内可商用AI加速卡出货量中位列第六,已进入国产算力加速卡第一梯队 [3] 公司治理与人才 - 清微智能创始人、董事长兼CEO王博近期获得“2025中国IC设计业年度企业家”称号 [4] - 评审意见认为其在新型架构AI芯片国产化方面具备前瞻布局与持续推进能力 [4]
超20亿融资加持!清微智能冲刺“非GPU”芯片上市标杆,启动上市筹备
是说芯语· 2025-12-02 12:44
融资与上市筹备 - 公司完成超20亿元人民币C轮融资并同步启动上市筹备工作 [1] - 此次动作旨在成为国内非GPU新型架构芯片领域首个上市标杆 [1] 投资方与资金用途 - 本轮融资由京能集团领投,北创投、建投投资、武岳峰科创、成都科创投等联合跟投,老股东京国瑞、中关村科学城公司、商汤国香资本等持续追投,形成多元化投资矩阵 [3] - 融资资金将重点投向下一代可重构芯片核心技术研发、智算场景规模化落地及高端技术人才引育 [3] 技术与产品优势 - 公司依托清华大学二十年技术积淀,深耕可重构计算赛道,构建独特非GPU技术路径优势 [3] - 量产的TX81可重构AI芯片通过C2C算力网格技术实现高带宽低延迟,搭载该芯片的REX1032训推一体服务器单机算力达4 PFLOPS,支持万亿参数大模型部署,相较传统方案成本降低50%、能效比提升3倍 [3] - 公司产品已适配DeepSeek、Qwen、商汤日日新等主流大模型 [3] 市场地位与业务进展 - 公司在浙江、北京、安徽等多地落地千卡规模智算集群,累计可重构算力卡订单超2万张 [3] - 2025年上半年在国内主要可商用AI加速卡出货量中位列第六,成功跻身国产算力第一梯队 [3] 创始人荣誉与行业意义 - 公司创始人、董事长兼CEO王博荣膺2025中国IC设计业年度企业家称号,评委会肯定其推动新型架构AI芯片国产化的战略远见 [4] - 公司的上市筹备将为非GPU赛道树立行业标杆,推动可重构计算技术生态化发展,引领国产AI芯片换道超车 [4]
ICCAD2025:中国芯片设计产值预测首超千亿美元,清微智能CEO王博获年度企业家
搜狐财经· 2025-11-28 10:11
行业整体趋势 - 2025年中国芯片设计销售额有望首次超过1000亿美元,重回高速增长区间 [1] - 行业专家预测,在AI等新技术推动下,中国芯片设计产业规模有望在2030年前达到或超过1万亿元 [3] - 2025年ICCAD-Expo汇聚了2000余家国内外企业和逾6300位行业专家 [3] 非GPU/AI芯片市场动态 - 截至2025年上半年,中国非GPU服务器市场占比达到30%,预计到2028年将增长至50% [3] - 国产非GPU芯片架构展现出强劲增长潜力,AI软件生态开始主动拥抱硬件创新 [5] - DeepSeek发布的v3.1大模型基于新一代国产芯片架构完成训练与推理,标志生态转变 [5] 可重构计算技术发展 - 可重构计算架构被视为国产AI芯片“换道超车”的战略机遇 [5] - 清微智能提出覆盖“云-边-端”场景的全栈式解决方案,通过三代芯片持续演进构建技术优势 [5] - 公司以C2C算力网格技术为核心,构建高带宽、低延迟数据流通路 [6] 清微智能公司进展 - 公司CEO王博荣获2025年度唯一“IC设计业年度企业家”称号,表彰其在新型架构AI芯片国产化的推动 [1][6] - 大规模量产的TX81芯片支持万亿参数大模型部署,解决方案成本相比同行业降低50%,能效比提升3倍 [6] - 自产品量产以来,已在多地布局千卡规模智算集群,累计可重构算力卡订单超20000张 [7] - 2025年上半年,公司在国内主要可商用AI加速卡出货量排行中位列第六,跻身国产算力第一梯队 [7] 行业盛会与认可 - ICCAD-Expo已成为中国集成电路设计业顶级盛会,今年举办第31届 [3] - IC设计年度企业家奖项自2012年设立至今仅有9位企业家获选,入围资格严苛 [10]
新架构芯片公司,缘何赢得全球资本押注?-财经-金融界
金融界· 2025-09-05 19:38
AI芯片技术派别分化 - AI芯片赛道分化为共享式集中计算架构和创新数据流架构两大技术派别[4] - 共享式集中计算架构以英伟达GPU为代表 凭借成熟生态占据市场主导[4] - 创新数据流架构包括分布式数据流架构和可重构数据流架构 正成为一级市场资本新焦点[4] 国际非GPU阵营企业融资与估值 - Groq在一年内从28亿美元估值增长至近60亿美元 最新完成6亿美元融资[1][4] - Groq自研LPU在推理速度上比英伟达GPU快10倍 成本仅为1/10[4] - SambaNova估值5年内飙升至50亿美元 其产品支持5万亿参数大模型训练[5] - SambaNova 8芯片配置性能达英伟达H100的3.1倍 总拥有成本仅为1/10[5] 国际非GPU技术应用与认可 - 谷歌自研TPU芯片已迭代多代 广泛应用于谷歌云服务器及大模型训练与推理[5] - OpenAI开始采用谷歌TPU支撑ChatGPT推理运算 被解读为数据流阵营崛起的重要信号[5] 国内AI芯片市场格局 - 国内AI芯片市场呈现GPU与非GPU架构并行发展格局[6] - 短期内GPU企业仍是科技资本重点布局标的 沐曦、摩尔线程等国产GPU企业相继启动IPO[7] - 寒武纪今年股价飙升 进一步带热GPU赛道资本关注度[7] 国内非GPU架构企业融资与技术 - 上海思朗科技获得宁德时代创始人曾毓群旗下溥泉资本领投的D轮融资[7] - 思朗科技自主研发MaPU架构 通过指令集与体系结构重构实现算力效率突破[7] - 清微智能获得国家大基金二期入股 累计完成多轮融资[8] - 清微智能TX8系列AI芯片2024年底正式量产 单机算力达4 PFLOPS[8] 国内非GPU企业商业化进展 - 清微智能在东北、浙江、北京等多省份落地千卡级智算中心[8] - 清微智能已在金融、能源、教育等行业完成服务器部署[8] - 清微智能与智谱华章协同发展 智谱华章估值达200亿元[9] 技术创新与生态挑战 - 国内非GPU架构单卡算力接近英伟达主流产品 但与最新产品仍存在一到两代差距[10] - 新型架构芯片从研发到生态建设通常需要3-5年 投入超10亿元[10] - 创新架构需突破算法适配、工具链完善等多重障碍 生态建设需3-5年才能缓解薄弱困境[10] 资本投资逻辑与战略价值 - 资本最核心考量指标为技术的前瞻性和稀缺性[3][11] - 政策性资本和产业资本重点关注具备创新架构的企业[7] - 清微智能获得国家大基金二期、中关村科学城科技投资、北京政府引导基金等国有资本入股[8]
英伟达学徒遍地,他偏要另起炉灶
虎嗅· 2025-08-15 17:21
公司技术路线 - 采用可重构芯片架构 与英伟达GPU的指令驱动+共享存储范式不同 属于无指令配置+数据流驱动架构 [2][3] - 通过动态配置计算单元实现多功能任务转换 类比铁路道岔切换机制 [2] - 脱离传统冯诺依曼架构 计算过程无需取指译码 直接通过通信接口实现芯片间数据传输 [3][5] 产品发展历程 - 2018年成立公司 2019年推出首枚量产可重构芯片(智能手机语音唤醒芯片) [6][9] - 2022年初立项云端TX8系列芯片 2023年底首枚AI算力芯片TX81开始批量出货 [11] - TX81芯片累计订单超20000枚 半年内实现全国多地千卡智算中心落地 [11] 性能与成本优势 - TX81芯片打造的REX1032服务器单机算力达4 PFLOPS 支持万亿参数大模型部署 [14] - 千卡直接互联无需交换机 采用DDR存储替代昂贵HBM存储 [14][25] - 下一代产品将应用3D存储技术 预计2026年下半年交付 [15][27] 市场竞争策略 - 要求产品具备5倍性价比优势(性能更优+成本更低)以应对生态劣势 [14][24] - 通过三层兼容方案对接生态:CUDA API兼容/Triton编译器兼容/RISC-V指令集兼容 [28][29] - 与谷歌TPU/Groq/SambaNova等同属可重构数据流新架构阵营 形成第二技术阵营 [16][30] 技术差异化 - 动态可重构特性:程序运行中每十几纳秒重构一次计算单元连接方式 [19][20] - 与FPGA重构门电路不同 重点重构计算单元之间的连接通路 [19] - 3D存储技术与可重构架构具备天然适配性 突破传统二维平面布局限制 [26]