可重构芯片
搜索文档
可重构芯片突围:清微智能RPU崛起,“后GPU”算力谁主沉浮
环球网· 2026-01-14 13:28
AI芯片技术格局演变 - 2026年初,AI芯片战场正悄然转向,三大技术流派成形:GPU派、ASIC派与可重构数据流派[4] - GPU派以英伟达为代表,是当前AI芯片领域的绝对霸主,但其性能提升受制于“内存墙”、高功耗等问题[4] - ASIC派以谷歌TPU为代表,通过硬件与算法深度绑定实现极致能效,但存在算法迭代后硬件难匹配的风险[4] - 可重构数据流派以Groq的LPU和清微智能的RPU为代表,核心是“软件定义硬件”,兼具ASIC高效能与GPU灵活性[4] 行业领导者动态与竞争 - 英伟达在CES上发布Rubin平台,宣称推理成本降至十分之一,但面临战略焦虑[1] - Meta被曝考虑弃用英伟达GPU、转投谷歌TPU[1] - 2025年圣诞节,英伟达以200亿美元闪电收购估值仅69亿美元的初创公司Groq,溢价近3倍[1] - Groq的核心武器是其LPU,在大模型推理中性能可达GPU的5–18倍,能效比提升10倍[1] 可重构芯片技术优势与案例 - 可重构芯片(如LPU/RPU)绕过传统GPU的内存墙,实现几乎“确定性延迟”的Token吞吐[1] - 清微智能的旗舰芯片TX81支持万亿参数大模型的训推一体[2] - 搭载TX81芯片的REX1032服务器可高效运行DeepSeekR1/V3等主流大模型,推理成本降低50%,能效比提升3倍[2][5] - 该技术路线正从细分走向主流,成为头部企业争相布局的核心方向[7] 中国关键玩家:清微智能 - 北京AI芯片公司清微智能自研的RPU与Groq的LPU同属可重构数据流架构,被业内称为“中国版高阶TPU”[2] - 2025年12月,公司完成超20亿元C轮融资[2] - 公司已实现从IP、芯片到服务器的全栈自研,并在全国部署超3万张AI加速卡,稳居国产第一梯队[2] - 清微RPU已落地国家“东数西算”工程,新疆双河市中树云智算中心全部采用其芯片构建[2] - 在生态层面,清微深度适配国产开源操作系统FlagOS,并与华为昇腾、寒武纪等共同组成“FlagOS卓越适配单位”[4] 市场定位与未来展望 - GPU派在训练和通用计算中保持核心地位[7] - ASIC派正用极致能效比主攻特定模型的推理场景,帮助云厂商降本增效[7] - 可重构数据流派以其灵活、高效、确定性,成为多元化AI芯片生态的重要力量[7] - 在这场决定下一代算力话语权的竞赛中,清微智能和它的RPU被视为中国打出的一张关键牌[7]
直击AI+教育场景核心痛点,清微智能联手灵书AI打造解决方案
21世纪经济报道· 2025-11-26 14:00
文章核心观点 - 在数字经济与智能技术加速发展的背景下,人工智能与职业教育的深度融合成为核心议题,旨在解决教学效率与人才培养质量提升的关键问题 [1] - 清微智能与灵书AI联手打造“AI+教育”整体解决方案,通过“芯片+算法+场景”的闭环生态,针对性解决职业教育AI落地的四大核心痛点:师资缺口、素养落差、算力不均与协同低效 [2][4][7] - 该方案以国产原创的可重构芯片技术为基础,结合专门的实验实训模型库,为职业教育提供了可落地、可扩展、可持续的智能化解决方案 [4][5][7] AI赋能职业教育的核心挑战与痛点 - 职业院校需要支撑上万人高并发、毫秒级低延迟响应且成本可控的算力,传统方案因高昂成本和能耗让许多学校望而却步 [1] - AI深度赋能教育面临四大核心挑战:师资缺口、素养落差、算力不均与协同低效,其中算力的成本、能耗和自主可控性是落地关键 [2] - 职业教育场景有高并发与低延迟的特殊需求,同时需控制采购与使用成本,并适应AI模型的快速迭代 [4] 清微智能的芯片技术与解决方案 - 公司专注于国产原创的可重构芯片研发,其技术核心是可动态调整硬件电路以适应不同算法的可重构计算架构 [3][4] - 可重构架构的优势包括:在不依赖先进制程下实现高端芯片性能,通过芯片间直连的算力网格技术实现多芯片微秒级直接互联,摆脱对外部交换机的依赖 [4] - 搭载TX81AI高算力芯片的REX1032训推一体服务器单机算力达4 PFLOPS,支持万亿参数大模型部署,解决方案成本相比同行业产品降低50%,能效比提升3倍 [4] - 针对教育痛点,通过硬件级优化满足万人级实时响应,凭借高能效比和C2C算力网格技术降低采购与电力成本,芯片灵活性可适应快速迭代的AI模型 [4] 灵书AI的算法与场景应用 - 灵书AI核心产品“元视MetaSight实验实训模型库”旨在破解传统实训教学的评价主观、反馈滞后、缺乏依据、管理困难等难题 [5] - 采用“一个实验,一个模型”的方法论,通过多机位采集超100小时专家操作视频,抽帧生成超200万张图片进行精细化标注,确保模型准确性 [5] - 在推理端使用多任务头模型,同时识别操作步骤和物品状态并关联,生成包含操作规范性、步骤完整性、流程正确性的量化评价报告 [6] - 系统实现从一张报告定成绩到全过程数据化评价的根本转变,学生获得即时反馈,教师可专注于个性化指导 [6] 合作生态与落地推广 - 清微智能与灵书AI构建“芯片+算法+场景”的闭环生态,共同举行模型库发布仪式,标志着AI教育场景化应用迈出实质性一步 [6][7] - 模型库作为开放平台,首批共建院校包括深圳职业技术大学等十余所双高院校,后期将接入更多院校与企业资源开展共创,推动形成可复制、可推广的AI教育应用生态 [6] - 公司核心技术团队源自2006年成立的清华可重构实验室,专注可重构技术二十年,并获得国家集成电路产业投资基金、蚂蚁集团、百度等国家级和产业资本投资 [3]
这颗芯片点亮那一晚,中国工程师集体泪崩!
新浪财经· 2025-06-23 23:28
行业趋势与技术创新 - 摩尔定律面临物理极限,传统芯片算力增长难以满足AI爆炸式需求,架构创新成为破局关键[5] - 动态可重构芯片(RPU)通过无指令集直接计算和动态匹配计算单元实现高能效、高并发、高扩展性、高性价比四大优势[7][8] - 中国算力芯片采取"高阶国产替代"路径,从底层原创突破技术壁垒,类比电动车产业换道超车模式[9][14] 公司技术与产品 - TX81芯片采用800平方毫米极限尺寸裸片,结合C2C网格直连技术消除数据中转,提升算力利用率[35][36] - 全球首款规模化量产的可重构云端算力芯片,2025年已部署多个千卡集群算力中心[51] - 第二代TX82芯片研发中,计划2026年流片,持续强化自主可控技术路线[53] 创业历程与团队 - 创始人王博基于清华大学THINKER芯片技术,2018年联合尹首一教授创立清微智能,转型学术成果产业化[17][18][22] - 初创团队仅20余人,蜗居30平米办公室,自建研发流程与质量标准,完成全原创代码开发[29][32] - 核心成员包括华为、阿里背景的技术专家,攻克时钟器件定制等关键难题,承受千万美元级流片风险[39][40][41] 市场竞争与战略定位 - 避开GPU主导的存量市场,以可重构架构开辟AI算力新赛道,打破海外技术生态壁垒[28][49] - 与清华系企业智谱形成"AI原创双子星"协同,覆盖芯片与大模型软硬件全栈技术[53] - 复制中国电动车产业逆袭路径,通过原创技术+产业链整合实现高阶国产替代[12][14] 技术突破里程碑 - 首次流片遭遇电源匹配故障,经通宵调试后成功点亮芯片,标志架构可行性验证[42][43][44] - 独创3D存储堆叠等技术组合拳,解决多卡互联编程难题,释放澎湃算力[14][36] - 六年研发周期远超传统芯片12-18个月迭代节奏,体现原创技术攻坚难度[41][51]