CloudMatrix384

搜索文档
计算机行业周报:计算机持仓占比低位!AI链商业化拐点将至-20250726
申万宏源证券· 2025-07-26 20:03
报告行业投资评级 - 看好计算机行业后续发展 [6] 报告的核心观点 - 25Q2持仓占比低位,三大逻辑看好后续计算机演绎;技术渗透与股价复盘,本轮AI行情符合科技板块演绎规律,AI链将迎来估值提升;科大讯飞推理大模型X1正式升级上线 [6] 根据相关目录分别进行总结 25Q2持仓情况 - 2025Q2计算机行业公募基金配置占比2.6%,较上季度降0.6pcts,处2010年来10%分位;配置系数0.56,较25Q1降0.11;持仓占比在三十个申万一级行业中排第十三 [8] - 2025年AI仍为计算机全年主线,看好后续演绎的逻辑有:国产算力推出超节点方案,性价比提升且与海外差距缩小;多款基础大模型推动AI应用商业化;多领域创新不断,稳定币、3D打印、物理AI等成看点 [9] - 前十大重仓股相对稳定,美图公司新进,用友网络退出;前十大中3家加仓,7家减仓;加仓AI应用相关标的,金融IT、AI应用加仓幅度大,拓维信息等获加仓 [17][18][21] 估值情况 - 2025年7月22日,计算机行业PE(TTM)为85.4x,处历史93.40%分位数,PS(TTM)为3.4x,处历史48.90%水平,PCF(TTM)为45.7x,处历史13.00%水平;当前估值超2020年、2023年高点,后续随着宏观经济复苏等,估值有望消化、市值提升 [24] 技术渗透与股价复盘 - 云计算以广联达为例,云渗透约15%-40%为最佳投资窗口期;智能驾驶以德赛西威为例,智驾渗透与业绩共振时为最佳投资窗口期;半导体以北方华创为例,最佳投资窗口期在低渗透率时期 [27][31][32] - A股不同科技板块演绎节奏受新技术确定性和可跟踪性影响;本轮AI行情符合科技板块演绎规律,AI应用类似云计算,预计下半年进入市值快速提升阶段,AI国产算力类似半导体+智能驾驶,业绩兑现后将迎市值抬升 [36][37] 重点公司更新 - 2025年7月25日,科大讯飞推理大模型X1升级上线,在综合能力、幻觉治理、多语言等方面提升,已用于多场景,24年大模型中标数量和金额国内第一,AI收入增长良好 [38] 重点标的 - 数字经济领军有海康威视、金山办公等 [47] - AIGC应用有金山办公、鼎捷数智等 [47] - AIGC算力有浪潮信息、海光信息等 [47] - 数据要素有税友股份、博思软件等 [47] - 信创弹性有海光信息、太极股份等 [47] - 港股核心有中国软件国际、金蝶国际等 [47] - 智联汽车有德赛西威、虹软科技等 [47] - 新型工业化有鼎捷数智、思看科技等 [47] - 医疗信息化有润达医疗、嘉和美康等 [47]
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超NV H100
量子位· 2025-06-29 13:34
AI算力投资趋势 - 马斯克旗下xAI计划将10万GPU集群规模扩大10倍,Meta拟投资100亿美元建设130万GPU数据中心,GPU数量成为衡量AI实力的核心指标[1] - 行业呈现简单粗暴的"堆卡"模式,但实际AI集群效能并非与GPU数量线性相关[2] 传统AI集群痛点 - 传统架构存在通信瓶颈、内存碎片化、资源利用率波动三大问题,GPU实际算力利用率受限[3][4] - 节点间采用RoCE网络通信,带宽仅200Gbps(25GB/s),存在南北向带宽瓶颈[23] - 超大规模模型运行时暴露算力不足、内存带宽受限、节点通信延迟高等问题,通信开销可占任务时长的40%[10][11][19] 华为CloudMatrix架构创新 硬件设计突破 - 采用384个NPU+192个CPU的超级节点设计,通过UB网络实现392GB/s单向带宽(相当于每秒传输48部1080P电影)[14][24] - 全对等互联架构消除CPU中转,AIV直连机制使传输延迟从10微秒降至1微秒,MoE场景通信耗时缩短70%[20][25][26] - 对比测试显示:预填充吞吐6688 token/s/NPU,解码吞吐1943 token/s/NPU,计算效率4.45 token/s/TFLOPS,均超越NVIDIA H100/H800[7] 软件栈协同 - 五大核心模块构成云原生软件栈:MatrixResource(拓扑感知资源分配)、MatrixLink(QoS保障网络)、MatrixCompute(自动扩缩容)、MatrixContainer(K8s容器化)、ModelArts(全流程MLOps)[33][34][36][37][40][41] - 内存池化技术实现全局内存视图,KV缓存访问延迟从毫秒级降至微秒级,缓存命中率提升至56%[27] - 支持15ms严苛延迟约束下的稳定推理,维持538 token/s解码吞吐量[28][44] 性能与成本优势 - DeepSeek-R1模型迁移仅72小时(传统方案需2周),INT8量化精度与官方API一致[7][54] - 首Token延迟降低80%,NPU采购量减少50%,万卡集群故障恢复时间<5分钟[44][52] - 在50ms TPOT约束下实现1943 token/s/NPU解码吞吐,严苛15ms场景仍保持538 token/s[28] 行业范式变革 - 打破算力-延迟-成本"不可能三角",EP320专家并行模式下token分发延迟<100微秒[47][48] - 未来演进方向:节点规模扩展+资源解耦(CPU/NPU物理分离、注意力计算与解码路径解耦)[60][62][63] - 已部署乌兰察布等四大节点,10ms时延圈覆盖全国19个城市群,支持动态扩缩容[45][51]
华为CloudMatrix384算力集群深度分析
2025-06-23 10:10
纪要涉及的公司和行业 - **公司**:华为、NVIDIA - **行业**:AI基础设施行业 纪要提到的核心观点和论据 华为CloudMatrix384与NVIDIA架构对比 - **架构设计哲学差异**:NVIDIA是分层式、节点中心架构,华为是对等/解耦架构,资源池化形成逻辑上统一的计算实体[1][2][40] - **性能对比**:华为CloudMatrix - Infer服务方案在昇腾910C上运行MoE模型时,计算效率在预填充和解码阶段超越NVIDIA H100与H800数据,并非单NPU理论峰值算⼒超越,而是系统取胜策略体现[3] - **软件生态差异**:华为CANN软件生态系统相较于NVIDIA经营近二十年的CUDA生态,在成熟度、开发者基础、工具链丰富性及稳定性方面均存在显著差距[3] 华为CloudMatrix384架构剖析 - **架构蓝图**:以对等资源池化为核心哲学,将NPU、CPU等关键硬件资源解耦并汇聚成资源池,统一总线(UB)网络是实现愿景的关键技术,构建无阻塞全互联拓扑,实现近乎一致的跨节点与节点内通信性能[6][8][10] - **核心硬件组件**:昇腾910C NPU是核心,采用先进双Die封装技术,集成两类异构计算核心,具备充裕内存容量和带宽,原生双网络接口支持三平面网络架构;节点架构集成8颗昇腾910C NPU等,通过两级UB交换系统构成全互联网络,但软硬件高度绑定可能制约推广[12][14][16] - **CloudMatrix - Infer引擎**:是专为大规模MoE模型推理设计的综合性软件解决方案,核心架构创新是基于PDC解耦的对等服务架构,还有针对MoE推理的关键优化技术,形成高度垂直整合但相对封闭的生态系统[17][18][24] - **量化优化影响与精度格式比较**:上下文缓存影响最显著,多令牌预测在解码阶段重要,微批次流⽔线在预填充阶段效果好;华为INT8方案是复杂系统工程,需多团队协作,通用性差;NVIDIA FP8方案是平台化、水平化生态构建思路,降低开发者使用门槛[27][30][31] 华为CloudMatrix384与NVIDIA DGX SuperPOD多维度对比 - **市场领导者的架构**:NVIDIA H100 GPU是DG核心构成核心构成构成DGX节点和SuperPOD的核心,集群互联方案是分层架构,节点内通过NVLink与NVNVSwitchSwitch互联,节点间通过Infiniband网络互联,节点内外通信性能存在巨大差距[36][38][39] - **全面架构对比分析**:从单加速器、节点内互联、节点间互联、系统架构哲学、核心架构差异点、软件生态等维度对比,华为核心竞争力在于创新系统架构,可弥补单卡理论性能差距[40][43] - **优劣势提炼与理想应用场景**:华为优势在于极致Scale - Up能力等,劣势在于软件生态不成熟等,理想应用场景为大规模MoE模型推理服务等;NVIDIA优势在于顶级单卡性能等,劣势在于分层网络架构等,理想应用场景为通用AI模型训练与推理等[44][48] AI算⼒集群评估框架及应用 - **评估框架**:提出专为专为现代大规模AI集群群的多维度评估框架,包括理论峰值算⼒、内存子系统性能、网络互联能力、实际应⽤算效、系统扩展性、软件生态成熟度、总体拥有成本七⼤支柱及关键量化指标[49][51] - **框架应用**:华为策略是在网络互联能力上突破,最大化实际应⽤算效和系统扩展性,但在软件生态成熟度和总体拥有成本方面存在短板,是一种非对称竞争策略[58][59][60] 新闻分析报告评估 - **解读准确之处**:准确识别核心技术亮点,正确引用性能数据,到位解读市场意义[64] - **存在的潜在谬误或过度简化之处**:标题简化比较背景,忽略比较条件差异,对“无损”量化描述绝对[65] - **分析的局限性**:未深入探讨软件生态挑战,缺乏对商业风险和成本讨论,缺失地缘政治背景[66] 其他重要但是可能被忽略的内容 - **华为CloudMatrix384发展潜力与演进路径**:包括扩展超级节点规模、实现CPU与NPU资源物理级解耦、更细粒度的组件级解耦[67][68][69] - **华为CloudMatrix384面临的挑战**:CUDA的生态护城河难以逾越,还面临对受限制造工艺的依赖、供应链安全问题、潜在更高功耗和TCO等商业风险[69][70][71]
海通证券晨报-20250620
海通证券· 2025-06-20 14:43
报告核心观点 - 2025年6月美联储按兵不动,滞胀预期加剧,关税和中东问题影响通胀,降息预期或收窄,短期滞胀交易或发酵,下半年或迎复苏交易 [2][3] - 上海超导科创板IPO获受理,核聚变产业化进程加速,建议关注核聚变上游设备环节 [2] 今日重点推荐 宏观专题:《滞胀担忧增加,美联储按兵不动》 - 美联储6月按兵不动,维持利率区间4.25%-4.5%不变,连续四次按兵不动符合预期,但滞胀预期加剧,下调经济增长预测,失业率上升,物价指数提高 [2][10] - 关税对通胀影响未完全体现,中东问题或引发能源价格上涨助推通胀,未来通胀不确定性大 [2][10] - 美联储表态偏“鹰”,对2025年降息判断不变,对2026年降息次数降低,认为2025年不降息的官员增多 [2][10] - 短期美国通胀未明显反映关税影响,后续通胀中枢或抬升,掣肘降息,警惕降息预期收窄和全年不降息风险 [3][11] - 6月议息会议后,美国股债市场表现滞胀交易特征,短期内或进一步发酵,下半年减税法案等落地后或迎来复苏交易 [3][12] 行业跟踪报告:核电设备《上海超导科创板IPO获得上交所受理,核聚变产业化正在提速》 - 上海超导科创板IPO申请获受理,维持“增持”评级,建议关注核聚变磁体环节相关公司 [5][20] - 上海超导是全球领先的高温超导材料生产商,二代高温超导带材国内市场占有率超80%,2024年全球市场规模7.9亿元,预计2030年超百亿 [5][22] - 公司业绩迅速增长,2024年营收同比增长187.4%,实现扭亏为盈,产能不断提升,下游客户包括多个核聚变研究机构和公司 [6][22] - 核聚变产业化逐渐提速,具有多方面优点,超导材料用于制造超导磁体,成本占比30%-40%,将拉动高温超导材料规模化和产业链其他环节发展 [7][23] 今日报告精粹 宏观专题:《滞胀担忧增加,美联储按兵不动》 - 内容与今日重点推荐中的宏观专题一致 [10] 行业跟踪报告:房地产《四平八稳,轻装上阵》 - 5月房地产行业走势平稳,延续此前趋势,核心指标窄幅波动,促进止跌回稳是主旋律 [13] - 新模式提高行业门槛,预计城市更新将提速,下半年行业无金融风险,土地市场结构好,房企谋求新商业模式 [13][15] - 推荐开发类、商住类、物业类、文旅类相关企业 [16] 行业跟踪报告:汽车《5月重卡销量增速提升,以旧换新地开始起效》 - 以旧换新政策有望提升重卡链企业盈利能力,预计2025年国产重卡销量106万台,同比增长16%,推荐相关企业 [17] - 5月重卡销量增速明显回升,内销超出业界预期,以旧换新作用开始显现 [18] - 新能源重卡表现亮眼,天然气重卡有提升空间,5月重卡格局保持稳定 [18][19] 行业跟踪报告:核电设备《上海超导科创板IPO获得上交所受理,核聚变产业化正在提速》 - 内容与今日重点推荐中的核电设备报告一致 [20] 行业双周报:综合金融《大模型持续迭代,产业应用不断优化》 - AI在证券、银行、保险、消费金融、支付等行业场景逐步落地,推荐相关公司 [23] - 5-6月全球AI技术迭代加速,国产模型也取得突破,Wind推出指数策略增强AI平台,金融科技AI产品在大会上有显著突破 [24][25][26] 公司跟踪报告:云鼎科技(000409)《“走出去”战略持续推进,AI应用场景加速落地》 - 维持“增持”评级,预计公司2025-2027年营收和净利润增长,目标价上调 [27] - 工业互联网和ERP是增长驱动力,2025年第一季收入下降因竣工验收项目收入减少 [28] - 2024年公司产品“走出去”取得突破,基于盘古矿山大模型的AI应用场景加速落地 [28][29] 基金专题报告:《风险逐步释放,配置继续两端走》 - 报告旨在捕捉全球多资产投资机会,设计投资方案,介绍了多种投资策略及回测数据和配置建议 [30][31][32] - 2025年6月对A股、国内债市、美股、日股、印股、黄金等资产给出配置建议 [33] 行业跟踪报告:精细和专用化学品《光引发剂产品价格提升,关注行业领先公司》 - 随着光引发剂应用场景广泛,市场需求增长,产品价格提升,推荐相关公司 [34] - 环保要求和新兴应用领域推动光引发剂市场需求扩大,国内公司领先优势明显,行业集中度有望提升 [35] - 介绍了久日新材、扬帆新材、强力新材等公司的业务情况 [36] 行业跟踪报告:电子元器件《豆包家族产品革新,Agent落地进入加速期》 - 火山引擎进入新阶段,推进AI从实验室走向生产,为行业带来新趋势,推荐中芯国际 [39] - 豆包家族产品全线进阶,成本革命驱动普惠化,Agent落地进入加速期 [39][40][41] 行业跟踪报告:电子元器件《非摩尔补摩尔,CloudMatrix384加速国产算力突破》 - CloudMatrix384基于超节点架构与UB网络互连,提高推理效率,有望加速国产算力芯片应用,推荐相关公司 [42][44][46] - 介绍了CloudMatrix384的核心创新和性能优势,催化剂为国产算力集群架构升级迭代 [43][44][46] 行业跟踪报告:投资银行业与经纪业《增量改革聚焦科创,利好专业服务投行》 - 6月18日证监会发布科创板意见,推出“1+6”增量改革举措,利好专业服务投行,推荐头部券商 [47][48][49] - 出台背景是增强科创板制度包容性,新设科创成长层,扩大适用范围,多项增量改革强化对科技企业支持 [47][48] 公司跟踪报告:东芯股份(688110)《SLC NAND业绩加速修复》 - 公司SLC NAND升级迭代持续推进,产品品类丰富,2024年归母净利亏损收窄 [50][51] - 预计业绩加速修复,调整EPS预测,给予增持评级和目标价 [50] 公司跟踪报告:太阳纸业(002078)《浆纸价格有望企稳,公司盈利有韧性》 - 维持盈利预测和“增持”评级,成品纸价格走弱,浆价下跌后企稳,对纸价影响减弱 [53][54] - 2025年公司迎来投产大年,新产能支撑盈利规模扩张 [54] 公司跟踪报告:横店影视(603103)《暑期档或现爆款影片,影院业务有望受益》 - 给予“增持”评级,预测公司2025-2027年EPS,给予目标价 [56] - 2025年暑期档影片定档,质量值得期待,公司影院和电影出品业务有望受益 [59][60] 公司跟踪报告:山煤国际(600546)《产量明显回复,成本管控见成效》 - 维持“增持”评级,预计公司2025-2027年EPS,给予目标价 [61] - 2024年下半年产量回复,2025Q1产量增长,成本管控成效显著,预计全年产量和成本情况 [61][62] - 2024年煤炭贸易业务量增价减,进口货源结构优化 [63] 海外报告:伟仕佳杰(0856)《受益AI浪潮,承接东南亚算力出海》 - 首次覆盖给予“增持”评级,预计公司2025-2027年营收和EPS增长,给予目标价 [64] - 公司是亚太地区科技产品渠道服务商,业务覆盖多领域,财务数据良好,预计受益于业务结构优化和国产品牌市占率提升 [65] - 传统主业受益AI浪潮,东南亚算力出海有优势 [66] 金融工程周报:《上周盈利、超预期因子表现较好,本年中证2000指数增强策略收益15.72%》 - 介绍了公募指数增强基金、单因子、大类因子、指数增强组合的表现情况 [67][68][69]
未知机构:浙商通信张建民海外CSP资本开支好于预期国内AI互联实现重大突破-20250507
未知机构· 2025-05-07 10:55
纪要涉及的行业和公司 - **行业**:通信、算力产业链 - **公司**:微软、谷歌、亚马逊、Meta、华为、硅基流动、新易盛、中际旭创、天孚通信、太辰光、博创科技、英维克、淳中科技、华丰科技、欧陆通、意华股份、紫光股份、申菱环境、高澜股份、光环新网、润泽科技 纪要提到的核心观点和论据 - **海外CSP资本开支好于预期**:25Q1四家头部CSP资本开支711亿美元,同比+59%,其中微软158亿同比+59%、谷歌172亿+43%、亚马逊243亿+62%、Meta129亿+93%;Meta上调25全年资本开支计划至640 - 720亿美元,此前为600 - 650亿美元,其余三家维持年初计划不变;根据彭博,2025年四家海外CSP资本开支增速达40% [1] - **国内AI互联实现重大突破**:华为CloudMatrix 384以384张昇腾910C算力卡组成超节点,在已商用超节点中单体规模最大;硅基流动联合华为云基于该超节点昇腾云服务上线DeepSeek - R1,单卡Decode吞吐突破1920Tokens/s,可比肩H100部署性能 [1][2] - **算力产业链估值具性价比,看好修复空间**:提及新易盛、中际旭创等多家公司 [3] 其他重要但是可能被忽略的内容 - 风险提示:AI应用发展不及预期等 [4]