Workflow
AI训练
icon
搜索文档
优刻得全浸没液冷机柜上架乌兰察布,GPU算力密度提升50%
21世纪经济报道· 2026-02-06 10:55
公司产品与技术进展 - 优刻得液冷机柜在乌兰察布智算中心正式上架,进入规模化商用阶段 [1] - 该方案通过精密结构设计,将整机高度从传统6U压缩至4U,支持8张高性能GPU卡,算力密度提升50% [1] - 采用全浸没式液冷技术,可使GPU工作温度降低15°C,整体功耗下降15%,运行噪音低于35dB [1] 产品应用与市场定位 - 该液冷机柜方案适用于AI训练、AI推理、超算等持续高负载场景 [1]
2026年AI最大的叙事变化是什么?
华尔街见闻· 2026-02-02 21:33
行业焦点转变:从AI训练到推理 - 2026年可能成为AI推理工作负载超越训练的转折之年 [1] - 行业焦点正从训练转向能够真正带来投资回报的推理环节 [1] - 到2030年预计1.2万亿美元的AI资本开支中,推理最终可能占据多数份额或达75% [1][4] AI资本开支与芯片板块表现 - AI资本开支的持续增长正推动芯片板块强劲表现 [1] - 费城半导体指数(SOX)年初至今上涨约13%,创下过去20年中第二好的1月表现,远超标普500指数仅1%的涨幅 [1] - 这轮上涨由存储芯片、半导体设备商以及模拟芯片厂商引领,而非由计算领域龙头英伟达和博通推动 [1] - 超大规模云服务商强调AI投资对维持两位数增长至关重要,其表态为市场注入信心 [2] 主要芯片公司表现与前景 - 英伟达保持领先地位,拥有最广泛的产品管线,涵盖训练与推理领域,并具备供应保障优势 [5] - 博通与谷歌、Anthropic保持良好合作关系,并在OpenAI、苹果和xAI获得新机会 [5] - AMD作为英伟达通用芯片的可靠第二供应商 [5] - 存储和半导体设备供应商的机会持续存在,尽管近期大涨后波动性可能加大 [5] - 根据表格数据,年初至今部分公司股价涨幅显著:美光科技上涨45.4%,拉姆研究上涨36.4%,ASML上涨33.0%,应用材料上涨25.4%,英特尔上涨25.9% [2] 推理市场的芯片机会 - 推理工作负载需要一系列在成本和性能上优化的芯片解决方案 [4] - 从GPU、CPU到ASIC等多种硅解决方案都将在推理市场中找到定位 [3] - 市场对谷歌内部自研芯片风险的担忧被夸大,导致博通股价下跌过度 [5] - 市场对台积电2纳米制程的过度担忧导致AMD股价下跌,但该制程进展仍在正轨 [5] 光学连接与铜缆市场 - 光学收发器和组件供应商成为仅次于存储芯片的最强劲芯片板块表现者 [6] - 随着AI集群规模和带宽需求扩大,增加光学连接的必要性毋庸置疑 [6] - 除Meta外,超大规模云服务商对共封装光学的兴趣证据有限,原因是其运营复杂度更高 [6] - 据Lightcounting分析,CPO销售在2026/27年预计仅占约460亿美元以太网收发器市场的约1%(约5亿美元) [6] - 铜缆仍具相关性,建议买入主动电缆领导者Credo Technology Group [6]
宇树科技成为2026年央视春晚机器人合作伙伴
新浪财经· 2026-02-02 04:19
公司与央视春晚合作历程 - 公司宣布成为2026年央视春晚机器人合作伙伴,这是其继2021年和2025年后的第三次合作 [1] - 2021年牛年春晚,公司机器牛“犇犇”首次亮相,与艺人共同表演 [1] - 2024年龙年春晚,公司与导演合作,人形机器人实现了全自动跳舞 [2] - 2025年蛇年春晚,公司H1人形机器人应用AI训练和激光SLAM定位系统,与真人舞者共同完成流畅整齐的表演 [2] 公司业务与市场地位 - 公司机器人出货量已经全球领先 [2] - 2025年,公司人形机器人实际出货量超过5500台,本体量产下线超6500台 [2] - 2025年,公司纯人形机器人数量占全球市场的32% [2] - 公司的四足和人形机器人在工业场景如物流、巡检等领域应用广泛 [2] 公司战略与品牌展示 - 公司将借助央视春晚这一全球性舞台展示前沿机器人技术 [1] - 对于2026年春晚合作,公司表示将带来“引领全球科技进步的除夕盛宴”,具体形式尚未公布 [2]
平头哥芯片卖爆了!
国芯网· 2026-01-30 21:58
平头哥“真武”PPU芯片市场表现与产品信息 - 阿里巴巴旗下芯片业务平头哥的“真武”PPU芯片总出货量已达数十万片,超越寒武纪,在中国国产GPU厂商中处于领先地位[2] - 该芯片已在阿里云实现多个“万卡集群”部署,服务中国国家电网、中国科学院、小鹏汽车、新浪微博等超过400家客户[4] - 市场呈现供不应求状态,在业内口碑良好[4] “真武”PPU芯片技术规格与性能 - 芯片采用自研平行运算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研[4] - 存储器为96G HBM2e,片间互联带宽达到700 GB/s[4] - 可应用于AI训练、AI推理和自动驾驶领域[4] - 对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流中国国产GPU,与英伟达H20相当[4] “真武”PPU芯片的应用与生态 - 阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理[4] - 结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务[4] 平头哥公司背景与产品线 - 平头哥成立于2018年9月,是阿里巴巴集团全资半导体芯片业务主体,用以推动阿里对云端一体化的芯片布局[4] - 除真武810E外,平头哥主要产品还包括含光800 AI推理芯片、倚天710 Arm服务器CPU、镇岳510 SSD主控芯片以及羽阵超高频RFID电子标签芯片[5]
微软这颗芯片,撼动英伟达?
半导体行业观察· 2026-01-29 09:15
微软Maia AI加速器战略背景 - 微软是OpenAI模型的最大用户及构建GPT模型的最大计算合作伙伴,这为其打造更强大的Maia AI加速器提供了双重动力[2] - 大型云服务商及主要GenAI模型开发商(如OpenAI、Anthropic、Meta)均在开发定制AI XPU,以降低生成式AI推理的单代币成本[2] - 人工智能推理预计所需计算能力将比训练高出一个数量级,为超过一百家人工智能计算引擎初创公司创造了市场机会[2] 云服务商自研芯片的行业逻辑 - 微软等云服务商希望掌控自身硬件资源,同时保留通用x86 CPU及英伟达/AMD GPU以满足客户租用需求[3] - 云服务商通过自研计算引擎并以低于第三方产品的价格竞争,旨在减少对传统芯片供应商的依赖[3] - 类似逻辑也适用于亚马逊AWS、谷歌、百度、阿里巴巴、腾讯等自行设计CPU和XPU的公司[3] - Meta Platforms虽非严格意义上的基础设施云,但通过出租硬件运行Llama模型API,正成为面向主权国家的GenAI平台云[3] Maia 100 (Athena) 芯片设计与性能 - 芯片发布于2023年11月,设计初衷是支持AI训练和推理,并专门用于运行OpenAI的GPT模型[4] - 芯片采用台积电5纳米工艺,面积820平方毫米,晶体管数量1050亿个[12] - 计算引擎包含64个核心(推测良率下有效核心数可能为52-56个),运行频率约2.86 GHz[12] - 芯片上L1/L2缓存总容量约500MB,SRAM带宽估计为132 TB/秒[12] - 配备4组HBM2E内存,总容量64GB,带宽1.8 TB/秒[12] - 每个核心的张量单元支持微软特有的MX6(6位)和MX9(9位)数据格式[13] - 互连I/O带宽为12个400 Gb/s端口,总计4,800 Gb/s(600 GB/s)[14] - 网络设计支持构建包含576个节点、总计2304个计算引擎的集群域[19] - 芯片峰值热设计功耗(TDP)为700瓦,持续功耗为500瓦[20] Maia 200 (Braga) 芯片的升级与改进 - 芯片于2026年1月发布,专门针对AI推理任务,简化了设计[5] - 采用台积电N3P(3纳米高性能版)工艺,面积836平方毫米,晶体管数量1440亿个[21] - 核心数量增至96个,良率约92%,主流产品预计有88个可用核心[20][22] - 运行频率提升至3.10 GHz[20] - L1/L2缓存SRAM容量降至272MB,SRAM带宽降至80 TB/秒[20] - HBM内存升级为6组HBM3E,总容量216GB,带宽大幅提升至7 TB/秒[20][22] - 后端网络带宽提升至56个400 Gb/s端口,总计22.4 Tb/s(2.8 TB/s)[20][21] - 主机互连升级为PCI-Express 5.0 x16,带宽64 GB/秒[20] - 集群相干域规模扩大,支持最多1536个节点和6144个计算引擎[19][20] - 性能方面,FP4精度达10.15 petaflops,FP8精度达5.07 petaflops,BF16精度达1.27 petaflops[20][24] - 持续热设计功耗(TDP)为750瓦[20] - 张量单元仅支持FP4和FP8格式,向量单元支持BF16和FP32,不再支持Maia 100特有的MX6/MX9格式[13] Maia 200的部署与应用 - 首批Maia 200机架已部署在美国中部的Azure云区域(爱荷华州得梅因),美国西部3区域(亚利桑那州凤凰城)也将跟进[26] - 微软将使用Maia 200计算引擎为OpenAI GPT-5.2大型语言模型提供推理服务,驱动Microsoft Foundry AI平台及Office 365 Copilot[26] - 微软的AI研究人员还将使用Maia 200生成合成数据,用于训练内部模型[26] - 目前尚未有关于Azure何时会提供基于Maia 200的虚拟机实例供租用的消息[26]
Reddit stock is tumbling and YouTube may be to blame
Invezz· 2026-01-28 02:06
核心观点 - Reddit股价在2026年1月27日出现暴跌,主要源于其作为AI模型主要数据源的地位被YouTube取代,以及分析师对该公司2026年收入增长放缓的警告[1] 股价表现与市场反应 - Reddit股价当日早盘暴跌,较年初至今的高点下跌超过20%[1] - 自2025年4月以来,公司股价经历了显著上涨,部分投资者选择在增长预期放缓时快速卖出以锁定利润,这加剧了抛售压力[1] - 即使在此次下跌后,公司股票估值仍然昂贵,其远期市盈率约为57倍,高于英伟达等领先AI公司约42倍的远期市盈率[1] - 公司股价目前略高于184美元的100日移动平均线,若明确跌破该水平,可能在短期内加速看跌势头[1] AI数据源竞争格局变化 - 长期以来,Reddit因其以文本为主的格式易于机器读取,被视为“AI训练之王”[1] - 当前,Gemini和GPT-5等AI模型在处理视频转录和“理解”视频内容方面能力大幅提升,导致它们现在比Reddit更频繁地使用YouTube数据[1] - YouTube(谷歌旗下)被视作更优或更常被“引用”的AI数据源,这一根本性转变动摇了Reddit的核心投资逻辑,即其拥有AI公司必须付费获取的人类对话“金矿”[1] - 这一变化导致市场对Reddit数据的估值下降,因其“溢价估值”很大程度上依赖于其在AI数据领域的独特地位[1] 收入增长前景与广告竞争 - 克利夫兰研究公司的分析师Ross Walthall发布报告,对近期推动股价的高增长叙事进行了“现实检验”,将市场情绪从“无限增长”转向对2026年“增长放缓”的预期[1] - 报告指出,平台新广告商入驻速度放缓,虽然小型机构仍保持乐观,但美国大型客户已下调预测,且对今年在Reddit上增加支出的信心不足[1] - 分析师警告,TikTok和Snap Inc预计将在2026年更激烈地争夺广告预算,甚至ChatGPT也开始蚕食本可能流向Reddit的测试预算[1]
99%计算闲置?推理时代,存力比算力香
36氪· 2026-01-14 20:12
文章核心观点 - 市场对存储的热情因黄仁勋在CES 2026上关于Rubin架构的演讲而再次推升,该架构相比Blackwell需要搭载更多DDR和NAND,带动存储股价上涨 [1] - 市场关注点已从HBM拓展至DDR、NAND等传统存储领域,供需关系变化推动存储价格全面上涨 [1] - 核心判断:在2026-2027年间,DRAM(含HBM和DDR)、NAND和HDD的需求增长均快于供应增长,存储供需持续紧张,“供不应求”局面将延续至2027年 [2] - 存储厂商在“赚钱周期”倾向于维持供需“紧平衡”以实现收益最大化,而非进行可能导致行业再次低迷的“无序扩产” [4] 传统DRAM市场分析 - **市场格局与涨价驱动**:三大存储原厂(海力士、三星、美光)占据DRAM市场九成以上份额 [6]。DDR5 (16Gb)产品价格从2025年9月初的6美元上涨至31美元,涨幅逾5倍 [7]。涨价主因是供应端产能转向HBM挤压了DDR供应,而需求端因AI从训练转向推理,增加了对CPU侧和CXL“外挂内存”的需求 [9] - **资本开支与产能**:受AI及HBM需求带动,全球核心存储厂商对DRAM的资本开支从2024年开始维持两位数扩张 [9]。三大原厂资本开支重心更多侧重HBM而非传统DDR [10]。三大原厂DRAM合计月产能当前约为160万片,预计到2026年四季度提升至167.5万片 [12]。基于产能、切割良率(85%)及市占率(92.5%)测算,2026年全球DRAM供应量预计近449亿GB [14]。DRAM整体供应量从2024年开始呈现约18%的复合增长,至2027年有望达到530亿GB以上 [15] - **需求测算与增长**:DRAM总需求包括AI服务器中的HBM、DDR以及传统领域(PC、手机、工业等)需求 [17]。AI服务器是带动DRAM周期回暖的主因 [17]。根据黄仁勋CES 2026信息,Rubin架构单CPU搭载DDR容量从Blackwell的500GB提升至1.5TB [20]。假设英伟达CoWoS出货量在2027年扩产至190万片,估算AI服务器对DDR需求量在2026年和2027年分别达到80亿GB和144亿GB以上,同比增速分别为222%和80% [20]。传统领域(手机、PC、工业等)对DRAM需求量预计在2026年和2027年保持约5%的同比增长 [21]。综合测算,2026年和2027年DRAM整体需求量分别为439亿GB和542亿GB,同比增长25%和23% [21] - **供需缺口判断**:从增速看,2026年需求增长25%大于供给增长18%,2027年需求增长23%大于供给增长18.5%,供给增长赶不上需求扩张 [23]。从绝对量看,DRAM供需局面在2026年和2027年将更为紧张,预计2027年供需缺口可能扩大至2%左右 [23] NAND市场分析 - **市场概况与涨价**:NAND在AI服务器中担任“热数据仓库”角色 [25]。NAND Flash (32Gb MLC)产品价格从2025年年初的2.3美元上涨至4.27美元,涨幅达85% [26]。价格上涨分两阶段:上半年因厂商主动减产及政策刺激导致供给收缩;下半年因AI服务器中SSD需求量超预期增加导致“供不应求” [28] - **增量机会**:SSD在AI服务器的增量机会来自两方面:替代交付周期过长(达1年以上)的HDD;以及英伟达Rubin架构创新性加入“推理上下文存储平台(ICMS)”,每个Rubin GPU可拓展16TB的NAND,用于将KV Cache从HBM下沉以降低成本 [29] - **资本开支与供应**:全球NAND行业资本开支相对保守,厂商将更多开支投向DRAM领域 [30]。预计至2027年全球NAND资本开支回升至183亿美元,两年复合增速仅约6% [30]。NAND扩产主要通过增加3D堆叠层数升级现有产线,无需大量新建产线 [32]。当前NAND行业整体月产能约196万片,三大原厂合计产能占比约60% [35]。预计2026年NAND整体产能约2366万片,同比增长4% [35]。随着层数向300层以上突破,预计2026年和2027年单片晶圆生产的NAND量复合增速约12% [37] - **需求测算**:NAND需求来自AI服务器、传统服务器、手机、PC及其他领域 [39]。Rubin带来的增量:结合35万片CoWoS预期及每GPU新增16TB NAND,估算2026年Rubin对NAND需求量达78EB [39]。其他AI服务器需求:以NVL72为例,单台搭载NAND中值850GB,并假设2026年需求增长30%,估算2026年其他AI服务器对NAND需求量超180EB [39]。综合估算,AI服务器对NAND需求量在2026年和2027年分别为258EB和453EB,同比增长116%和77% [40]。手机和PC领域受涨价压力,出货量可能下滑,预计2026年和2027年需求量分别为298EB和187EB,仅微幅增长 [42]。传统服务器需求假设维持10%增长,其他领域复合增长5% [43]。综合估算,NAND整体需求量在2026年和2027年分别为1094EB和1325EB,复合增速近20%,AI服务器将在2027年成为NAND最大下游应用领域 [43] - **供需缺口判断**:从增速看,2026年需求增长18%大于供给增长16%,2027年需求增长21%大于供给增长20% [45]。从绝对量看,NAND在2026-2027年的供需缺口将维持在5-6%左右 [45] HDD市场分析 - **市场定位与成本优势**:HDD在AI数据中心中主要用于“冷存储”,如原始数据存储、AI日志与存档等,因其单位存储成本(TCO)仅为SSD的1/4到1/5 [48]。近线硬盘(NL HDD)是HDD中最大出货品类(占比八成以上),也是AI数据中心冷存储主要需求项 [53]。HDD单位存储成本和生产单EB所需资本开支分别只有SSD的1/4和1/50左右 [51]。HDD交付周期约1年(备货3个月+生产测试6个月),长于SSD的约2个月,部分客户因此“被迫”选择价格更高的SSD [51] - **供需情况**:核心HDD厂商(西部数据、希捷、东芝)对大规模扩产保持克制,希望通过控制供应量维持“紧平衡”以获取更高利润 [53]。HDD产能扩充可通过在硬盘内增加盘片和磁头实现,无需新建产线 [53]。预计NL HDD供应量增速在2026年和2027年分别为29%和19% [53]。结合西部数据预期,预估NL HDD需求量增速在2026年和2027年分别为33%和23% [53]。HDD市场紧张主要受核心厂商主动“控量提价”策略影响 [55]
拓维信息跌2.01%,成交额11.67亿元,主力资金净流出1.09亿元
新浪财经· 2026-01-07 10:40
公司股价与交易表现 - 2025年1月7日盘中,公司股价下跌2.01%,报33.58元/股,总市值为423.05亿元 [1] - 当日成交额为11.67亿元,换手率为3.01% [1] - 当日主力资金净流出1.09亿元,其中特大单净卖出5395.58万元,大单净卖出5500万元 [1] - 公司股价年初以来上涨1.45%,近5个交易日下跌0.56%,近20日上涨8.32%,近60日下跌4.93% [1] 公司基本业务与行业 - 公司全称为拓维信息系统股份有限公司,成立于1996年5月20日,于2008年7月23日上市 [1] - 公司主营业务涉及面向K-12的教育服务和基于手机游戏、动漫的移动互联网产品 [1] - 主营业务收入构成为:软件及服务占72.71%,智能计算产品占21.74%,其他占5.55% [1] - 公司所属申万行业为计算机-软件开发-垂直应用软件,概念板块包括华为昇思、华为昇腾、移动支付、AI训练、智能交通等 [1] 公司股东与股权结构 - 截至2025年9月30日,公司股东户数为45.91万户,较上期增加1.17%,人均流通股为2495股,较上期减少1.19% [2] - 截至2025年9月30日,南方中证500ETF为第三大流通股东,持股1463.68万股,较上期减少32.11万股 [3] - 香港中央结算有限公司为第四大流通股东,持股1251.61万股,较上期增加780.78万股 [3] - 易方达中证人工智能主题ETF为第六大流通股东,持股820.18万股,较上期减少42.70万股 [3] - 嘉实中证软件服务ETF为第七大流通股东,持股536.36万股,较上期增加132.94万股 [3] - 华富中证人工智能产业ETF为新进第八大流通股东,持股427.82万股 [3] - 华夏中证人工智能主题ETF为第九大流通股东,持股314.71万股,较上期增加24.67万股 [3] - 诺安积极回报混合A已退出十大流通股东行列 [3] 公司财务与分红 - 2025年1月至9月,公司实现营业收入20.78亿元,同比减少29.43% [2] - 2025年1月至9月,公司实现归母净利润1.05亿元,同比增长852.03% [2] - 公司自A股上市后累计派现1.38亿元,但近三年累计派现0.00元 [3]
首都在线跌2.01%,成交额3.45亿元,主力资金净流出3311.76万元
新浪财经· 2026-01-07 10:35
股价与交易表现 - 2025年1月7日盘中,首都在线股价下跌2.01%,报22.44元/股,总市值112.85亿元,当日成交额3.45亿元,换手率3.89% [1] - 当日资金流向显示主力资金净流出3311.76万元,其中特大单与大单均呈现净卖出状态,特大单买卖占比分别为4.79%和9.21%,大单买卖占比分别为17.66%和22.84% [1] - 公司股价年初至今下跌1.71%,但近期表现分化,近5个交易日上涨1.04%,近20日上涨14.84%,近60日下跌1.45% [1] 公司基本面与财务数据 - 公司主营业务为高性能IDC服务及云服务,2025年1-9月实现营业收入9.26亿元,同比减少12.05% [1][2] - 2025年1-9月,公司归母净利润为-9941.30万元,但同比亏损收窄,增长32.11% [2] - 主营业务收入构成中,云主机及相关服务占比49.89%,IDC服务占比45.83%,其他收入占比4.28% [1] 股东结构与机构持仓 - 截至2025年9月30日,公司股东户数为6.57万户,较上期大幅减少25.68%,人均流通股增至5961股,较上期增加34.76% [2] - 同期十大流通股东中,香港中央结算有限公司为第二大流通股东,持股825.44万股,较上期增加471.51万股;财通资管数字经济混合发起式A为新进第三大流通股东,持股678.89万股 [3] - 公司自A股上市后累计派现2056.58万元,但近三年累计派现0.00元 [3] 公司背景与行业属性 - 北京首都在线科技股份有限公司成立于2005年7月13日,于2020年7月1日上市 [1] - 公司所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ,所属概念板块包括华为昇腾、信创概念、AI训练、元宇宙概念、数据要素等 [1]
高负载不卡顿:i7处理器编程体验大升级
新浪财经· 2026-01-07 09:45
文章核心观点 - 文章为一篇面向程序员群体的处理器产品推荐文章,旨在为不同开发场景(移动办公、高性能桌面、主流桌面)推荐三款定位和性能各异的英特尔酷睿i7处理器,强调强劲的CPU对提升开发效率的重要性 [1][4] 产品推荐与规格分析 - **英特尔酷睿 i7-9750H (移动平台)**: 作为整机配置出现,到手价0.0元,采用14nm工艺,拥有6核12线程,基础频率2.6GHz,最大睿频4.5GHz,配备12MB三级缓存,推荐搭配RTX 2070 Max-Q显卡、16GB DDR4内存、17.3英寸1080p屏幕及1TB HDD+512GB SSD双存储,适合移动开发和轻量级AI训练 [1][5] - **英特尔酷睿 i7-12700F (桌面平台)**: 到手价2280.0元,采用第12代Alder Lake架构与Intel 7工艺,拥有12核20线程(8性能核+4能效核)的混合设计,最大睿频4.90GHz,配备12MB二级缓存和25MB三级缓存,支持DDR5 4800 MT/s内存和PCIe 5.0,TDP为65W,搭配Z690主板可超频,适合高性能计算和未来升级 [3][5][6] - **英特尔酷睿 i7-9700 (桌面平台)**: 到手价2599.0元,为前代产品,拥有8核8线程,最大睿频4.90GHz,TDP为65W,支持DDR4-2666内存和PCIe 3.0,在Windows生态下驱动优化和软件兼容性具优势,适合预算有限、追求稳定性的开发场景 [3][6] 目标应用场景与用户定位 - **i7-9750H**: 主打便携与综合性能,适配需要频繁出差或远程办公的移动开发者 [1][7] - **i7-12700F**: 面向高性能桌面平台,适合本地搭建Kubernetes集群、运行多个Docker容器、大规模数据处理与算法仿真等任务,引领多线程处理潮流 [3][6][7] - **i7-9700**: 以成熟稳定的平台表现守住主流市场,尤其在Java后端、Web全栈开发等对单核性能敏感的领域具备竞争力,适合务实派开发者 [3][6][7]