GPGPU架构 - 财报，业绩电话会，研报，新闻

GPGPU架构

搜索文档

搜狐财经· 2026-01-02 10:55

上市概况与市场表现 - 上海GPU龙头企业壁仞科技于2026年1月2日在港交所挂牌上市，成为港股“国产GPU第一股”及2026年港股市场首只上市新股 [2] - 公司发行价为每股19.60港元，开盘价上涨82.14%至每股35.70港元，开盘市值为855.42亿港元 [2] - 截至当日9点35分，股价进一步上涨至每股41.80港元，最新市值达到1002亿港元 [2] - 公司2022年收入为49.9万元，2024年收入增至3.37亿元，年复合增长率高达2500% [3] - 截至2025年12月15日，公司在手销售订单约12.41亿元，将转化为未来收入 [3] 技术实力与研发投入 - 公司是中国首家采用2.5D芯粒技术封装双AI计算裸晶的GPGPU公司，在业内率先支持先进互连规范 [5] - 公司产品支持DeepSeek、Qwen、Llama等主流开源大模型，在万亿参数大模型训练及推理等重点场景下展现了技术成熟度 [5] - 公司研发人员比例高达83%，研发费用占比超过70% [8] - 截至2025年12月15日，公司在全球累计申请专利1500余项，位列中国GPGPU公司第一，获得专利授权600余项，发明专利授权率达100% [9] - 公司是中国首批在商业化产品中使用PCIe 5.0、CXL、高性能DRAM、双裸晶芯粒等设计的GPGPU公司之一，并专注于3D堆叠、CPO等先进技术研发 [11] - 公司是首家也是唯一一家受邀在国际顶级芯片设计会议Hot Chips上发言的中国GPGPU公司 [12] - 公司在MLPerf Inference 2.1的封闭组别竞赛中，其GPGPU芯片及搭载该芯片的服务器在BERT及ResNet50模型上均获得量产芯片组别第一名 [12] 产品架构与技术创新 - 公司基于自研GPGPU架构，完成了从芯片设计、软件平台到系统级交付的闭环 [6] - 公司已推出BR106、BR166、BR110等多款芯片，覆盖云端训练、云端推理、边缘推理场景 [15] - 下一代BR20X系列计划在2026年商业化上市，将增强对FP8、FP4等数据格式的支持 [15] - 通过共封装2个BR106芯片裸晶，公司推出了性能达BR106芯片产品2倍的BR166芯片，两颗裸晶之间的D2D双向带宽达896GB/s [18] - 公司GPGPU架构引入多项创新：采用SIMT架构高效处理并行计算；自研T-core张量引擎可降低带宽需求；采用带组播的异步数据传输技术；应用近内存计算技术 [18][19] - 自研BLink技术可实现GPU卡间连接，最大双向数据传输速率高达每通道64GB/s；公司率先在中国推出商用GPU光互连技术 [22] - 公司提供PCIe板卡、OAM、服务器等多种产品形态，是中国首批成功开发、原型验证及量产高性能OAM及通用底板的GPGPU公司之一 [22] 软件平台与集群解决方案 - 公司自研计算软件平台BIRENSUPA提供完整工具链，并兼容第三方GPGPU计算软件平台，显著降低了客户迁移成本 [31] - 公司对DeepSeek、Qwen、Llama等主流开源模型进行原生优化，其Model Zoo托管针对BIRENSUPA进行原生优化的AI模型 [31] - 公司正在与清华大学、复旦大学等知名高校开展超过30项联合项目，培育本土GPU开发者生态 [31] - 公司BIRENCUBE集群管理平台旨在管理广泛的AI硬件基础设施，能够帮助客户构建包含成千上万块GPGPU芯片的GPU集群系统 [31] - 2024年，公司赢得了商业化AIDC千卡GPU集群等里程碑项目，并将其GPGPU集群部署于5G新通话等应用场景，与中国三大电信运营商均建立合作伙伴关系 [32] - 截至2025年6月22日，公司已服务9家财富中国500强企业，其中5家上榜财富世界500强，战略性拓展了AI数据中心、电信、金融科技等关键行业 [32] - 公司智能计算集群解决方案在可靠性及性能上领先，其千卡集群训练30天以上无中断，千卡集群线性加速比达到95% [34] 行业地位与竞争优势 - 公司是中国AI芯片代表公司，正在跑通一条可持续的自主高端算力路线 [5][6] - 相比ASIC、FPGA等路线，GPGPU具有更高的通用性和灵活性，占据AI芯片主流市场 [9] - 公司是中国最早实现千卡集群商用的GPGPU公司之一，也是中国首家在单一服务器中实现8块GPU卡点对点全网状拓扑的GPGPU公司 [12] - 公司两度摘得世界人工智能大会最高荣誉SAIL奖 [12] - 公司核心管理团队经验丰富，CTO洪洲在GPGPU设计及工程方案有近30年经验，曾担任英伟达主架构师；COO张凌岚在半导体行业拥有超过23年经验，曾担任AMD GPU SoC架构师 [12][13] - 公司代表性投资方包括上海国投先导基金、上海人工智能产业投资基金、启明创投、高瓴创投、平安集团、珠海格力等 [5] - 公司凭借在中国的本地化专业知识及实地客户支持能力，能够与重点行业的大型客户建立战略合作关系 [33]

“港股英伟达”要来了！壁仞科技上市在即，能否引爆AI芯片新一波热潮？

新浪财经· 2025-12-20 09:35

公司上市与市场地位 - 壁仞科技于12月17日通过港交所聆讯，即将成为港股第一家通用GPU上市公司 [1][13] - 公司是中国通用GPU领域首批获得市场广泛关注并首批登陆港交所的代表性企业之一 [4][16] 核心技术优势 - 公司构建了覆盖硬件、软件、高速互联、算力集群的完整智能计算解决方案体系，其五大支柱性技术包括：自主研发的GPGPU架构、系统级芯片（SoC）设计、硬件系统、软件平台和集群部署优化 [3][4][15][16] - 在SoC设计、硬件系统和集群部署优化领域尤为突出，是中国首家使用2.5D芯粒技术封装双AI计算裸晶的公司 [5][17] - 采用先进的Chiplet（芯粒）技术，例如BR166使用两颗BR106与四颗DRAM芯片共封装，突破单芯片光罩面积限制，提升整体性能 [5][17] - BR166在峰值算力、内存、视频编解码、互联等方面性能是BR106的两倍，两颗BR106裸晶间的D2D双向带宽可达896GB/s [7][19] - 公司是中国率先实现千卡集群商用的GPGPU公司之一，千卡集群可连续运行5天以上软硬件无故障，训练服务30多天不中断 [7][19] 产品商业化进展 - 特专科技产品于2022年8月正式商业化，营收高速增长：2022年约50万元，2023年约6203万元，2024年约3.37亿元 [8][20] - 已实现云训练及推理芯片BR106（2023年量产）、边缘推理芯片BR110（2024年10月量产）和云训练及推理芯片BR166（2025年推出）的量产 [5][17] - 下一代旗舰产品BR20X系列基于全新第二代架构，预计2026年商业化，目标全球云端高端市场；更远期的BR30X和BR31X也在规划中 [12][24] 财务与订单情况 - 经调整净亏损呈收窄趋势：2022年10.38亿元，2023年10.51亿元，2024年7.67亿元 [8][20] - 部分亏损源于“赎回负债账面值变动”的会计处理，该负债上市后将自动转权益，不影响现金流和实际经营 [8][20] - 截至2025年12月15日，公司已订立五份框架销售协议及24份销售合同，总价值约12.407亿元 [8][20] - 客户IT公司A因对产品满意，于2024年4月下达第二份订单（约1.37亿元）和第三份订单（约0.314亿元） [9][10][21][22] 客户与市场潜力 - 客户包含9家中国财富500强公司，其中5家为世界财富500强公司 [3][10][15][22] - 公司凭借本土化专业知识与AI数据中心、电信、能源、金融科技、互联网等关键行业大客户建立战略合作 [10][22] - 中国智能计算芯片市场以收入计，从2020年17亿美元增长至2024年301亿美元，年化复合增长率105%，预计2029年达2012亿美元，2024-2029年复合增长率46.3% [11][23] 管理团队与知识产权 - 董事长兼首席执行官张文拥有哈佛大学法学博士和哥伦比亚大学工商管理硕士学位，曾任商汤科技总裁 [11][23] - 首席架构师洪洲在GPU领域有近30年经验，曾任职于S3、英伟达和华为美国研究中心 [11][23] - 截至12月15日，公司在国内外拥有613项专利、40项著作权及16项集成电路布图设计，并正在申请972项专利，主要关于下一代技术及产品 [12][24]

2025-08-05 11:20

行业与公司 - 行业涉及国产AI芯片、算力卡市场及GPGPU架构发展[1][3][7] - 主要公司包括华为、海光、寒武纪、摩尔、沐曦、燧原、昆仑芯等[1][4][10] 核心观点与论据 **华为384超节点的优势与定位** - 采用光模块互联技术，速度显著提升，推理场景性价比高且落地确定性高[1][2] - 支持SP8格式，性能优于未配备SP8的国产卡，兼具训练能力[2][9] - 通过铜线连接和光模块实现高速传输，应对英伟达Nvlink瓶颈[8][9] **国产AI芯片技术进步与竞争格局** - 摩尔S5,000支持SP8和互联，沐曦C600支持FP8并采用先进工艺，性能接近国际水平[4] - 华为升腾转向GPGPU架构降低互联风险，燧原增加核心数量并向GPU靠拢[7] - 2026年新一代产品将提升性能，竞争格局复杂化但整体稳定[1][4][10] **超级点方案的应用** - 海光静默式液冷方案支持660张卡，总功耗750千瓦，突破单服务器限制[5][6] - 华为384超节点和海光700张卡集群成为推理市场重要形式[9][12] **市场需求与采购趋势** - 推理需求增长（多模态时代推动），国产算力卡占比提升[3][10][12] - 大型互联网公司（如字节跳动、阿里、腾讯）测试国产卡，需求集中在SP8、互联和产能[4][10] - 长尾客户（运营商、金融、央企等）需求旺盛，中国市场供不应求[3][16] 其他重要内容 **GPGPU架构发展趋势** - 国内厂商技术方案融合，华为升腾转向GPGPU，燧原缩小核心尺寸[7] - 2026年估值修复预期（寒武纪、海光），英伟达2023年估值中枢45倍，2024年40倍[7] **市场数据与收入** - 可灵2025年AI应用收入预计2亿美元（约15亿人民币），其他公司达数千万至数亿[10] - 国产算力卡2026年估值受关注，预计快速增长[13] **展会动态** - 摩尔、燧原等新产品支持互联和FP8，送测互联网公司或供货非互联网客户[14] **中美需求差异** - 美国需求集中于头部客户（90%），中国长尾客户（运营商、金融等）占比高[16]

傅里叶的猫· 2025-06-14 21:11

AI半导体产品更新 - 910D已确定为四个Die的设计与910C相比由两个Die升级为四个Die 增加了FP8配置并提升Switch规格生态层面有所优化但其他配置提升不明显 [1] - 910D单卡综合性能预计超过H100 可支持部分训练型应用但超过400亿参数的模型性价比会明显下降 [1] - 910D首批回片预计下月中旬量产出货最乐观为2025年第二季度最晚延迟至2026年第二季度末 [1] 新一代GPU架构进展 - 920首个版本采用双Die设计并优化工艺架构全面转向GPGPU 生态将与NVIDIA互通 [1] - 920回片时间预计2025年底量产出货时间为2027年年中或六七月份 [1] 行业服务动态 - 公司与国内数据中心厂商合作提供GPU租赁服务 [2] - 知识星球平台每日更新外资投行科技研报包含SemiAnalysis等机构完整报告及Seeking Alpha等精选内容 [3] - 平台推送精选国内外券商研报当前优惠价390元 [4]