Workflow
超节点架构
icon
搜索文档
26天15板!603122,再度涨停!
证券时报· 2025-12-05 12:45
市场整体表现 - 12月5日午间收盘,A股三大股指震荡上扬,沪指微涨0.08%报3878.99点,深证成指涨0.39%,创业板指涨0.47% [1] - 沪深北三市合计成交额达9996亿元 [1] - 市场板块表现分化,银行、地产、医药等板块疲弱,而商业航天、CPO、特高压、福建本地股等概念活跃 [1] CPO概念板块 - CPO概念盘中强势拉升,多只个股大幅上涨 [3][4] - 截至午间收盘,长光华芯20%涨停,股价创历史新高至128.82元 [4][5] - 东田微涨超12%,炬光科技、斯瑞新材、太辰光等涨超10%,天孚通信涨超5% [4][5] - 中信证券指出,AI大模型发展推动算力基础设施向“超节点”架构跃迁,驱动交换芯片、光模块及高速线模组需求从线性增长转变为指数级爆发 [5] - 国内AI算力投入较海外仍有巨大提升空间,“超节点”架构是国产算力建设实现后发赶超的必经之路 [5] 商业航天概念板块 - 商业航天概念再度活跃,截至午间收盘,超捷股份20%涨停,星环科技涨超15%,天箭科技、航天科技等多股涨停 [6][7] - 消息面上,12月3日,朱雀三号遥一运载火箭成功发射入轨,这是我国首个可重复使用运载火箭的入轨发射 [7][8] - 中信建投证券指出,朱雀三号成功入轨标志着我国商业航天产业迎来重大拐点,为星座组网提供了较低成本的新选择 [9] - 后续多款火箭将陆续首飞并开展回收试验,有望进一步打通产业瓶颈,带动卫星星座建设加速和应用端爆发 [9] 新股与个股表现 - 摩尔线程今日登陆科创板,早盘一度涨超500%,最高攀升至688元/股 [2][10] - 截至午间收盘,该股涨416.79%报590.59元/股,以盘中最高价计算,单签最高盈利超28万元 [11] - 公司主要从事GPU及相关产品的研发、设计和销售,以自主研发的全功能GPU为核心,服务于AI、数字孪生、科学计算等领域 [12] - 公司已成功推出四代GPU架构,产品线覆盖AI智算、高性能计算、图形渲染等多个应用领域 [13] - 合富中国再度涨停,在近26个交易日内斩获15个涨停板,截至午间收盘报26.53元/股,总市值105.6亿元 [1][14][15] - 消息面上,公司控股股东计划减持不超过公司总股本的2%,减持原因为充实运营资金 [17] - 控股股东目前持有公司55%的股份 [18] - 在10月28日至11月14日期间,公司股票累计涨幅高达256.29%,并多次触及股价异常波动 [18]
刚刚!一则大消息引爆市场!
天天基金网· 2025-12-02 16:31
政策目标与量化指标 - 到2027年底 福建省公共算力规模目标达到12 EFLOPS以上 并谋划建设一批中型算力基础设施项目 [2][4] - 新建及改扩建数据中心电能利用效率(PUE)需降至1.25以内 数据中心整体上架率不低于65% [4] - 计划打造不少于20个算力应用案例 并提升数据中心绿色能源使用比例 [4] 算力网络布局与基础设施规划 - 加快构建“一核两区多点”的全省一体化算力网络协同发展布局 以数字福建(长乐、安溪)产业园为核心 [5] - 推动福州都市圈和厦漳泉都市圈建设城市级数据中心 鼓励福州新区与平潭综合实验区协同打造面向两岸的算力协作支点 [5] - 引导各类算力向国家枢纽节点集聚 国家枢纽节点外原则上不得新建大型及超大型数据中心 [5] 网络传输效率与技术创新 - 提升算力网络传输效率 推进“福州—深圳短路径光缆”项目建设 升级扩容“福淡”“厦金”海底光缆 [2][8] - 加快400G/800G光传输、IPv6分段路由(SRv6)等技术部署 打造市域1ms、省域5ms等多级时延圈 [8] - 到2027年 重点应用场所OTN覆盖率达到90% 并部署不少于50个边缘节点 形成不少于5个典型案例 [8] 存储能力与架构发展 - 开展数据中心存储能力成熟度研究 推动全闪存、蓝光存储等前沿技术创新转化 [9] - 到2027年 先进存储容量占比目标达35%以上 并探索城域百公里级“存算分离”模式 [9] - AI大模型演进推动算力基础设施向“超节点”架构跃迁 驱动交换芯片、光模块等需求指数级增长 [9] 市场前景与机构观点 - 算力基础设施市场属于高速扩张的增量市场 尚未触及天花板 产业链对算力需求旺盛 [10] - 机构建议重点关注互联密度提升带来的机遇 如高速连接模组厂商、交换互联厂商、光模块厂商等 [9][10]
2分钟,涨停!一则消息,引爆市场!
券商中国· 2025-12-02 16:07
文章核心观点 - 福建省发布《福建省有序推进算力基础设施发展若干措施》,旨在加速算力基础设施高质量发展,目标到2027年底全省公共算力规模达到12 EFLOPS以上 [1][4] - 政策将推动算力网络传输效率提升、构建一体化算力网络布局并规范数据中心建设,全面赋能数字经济发展 [4][5][6] - 政策消息刺激福建本地算力相关股票出现显著异动,部分个股快速涨停或大幅上涨 [1] 算力发展目标与规划 - 到2027年底,全省公共算力规模达到12 EFLOPS以上,谋划建设一批中型算力基础设施项目 [1][4] - 新建及改扩建数据中心电能利用效率(PUE)降至1.25以内,数据中心整体上架率不低于65% [5] - 打造不少于20个算力应用案例,部署不少于50个边缘节点,形成不少于5个典型案例 [5][8] - 先进存储容量占比达到35%以上,重点应用场所OTN覆盖率达到90% [8][9] 算力基础设施布局 - 加快构建“一核两区多点”的全省一体化算力网络协同发展布局 [5] - 以数字福建(长乐、安溪)产业园为核心,围绕福州都市圈和厦漳泉都市圈建设城市级数据中心 [5] - 鼓励沿海和山区“结对子”,探索开展“算力飞地”合作,深化闽宁算力联动,创新“闽数宁算”合作模式 [6] 算力网络与技术升级 - 提升算力网络传输效率,推进“福州—深圳短路径光缆”项目建设,升级扩容“福淡”“厦金”海底光缆 [1][8] - 打造市域1ms、省域5ms、到粤港澳及长三角枢纽10ms、全国20ms四级时延圈 [8] - 加快400G/800G光传输、IPv6分段路由(SRv6)、智能无损网络等技术研发部署 [8] - 推动“中心云+边缘云+端设备”的多层次算力调度架构体系发展 [8] 市场观点与投资逻辑 - AI大模型演进推动算力基础设施向“超节点”架构跃迁,驱动交换芯片、光模块及高速线模组需求指数级爆发 [9] - 国内AI算力投入较海外仍有巨大提升空间,超节点架构是国产算力建设实现后发赶超的必经之路 [9] - 算力基础设施市场属于高速扩张的增量市场,建议重点关注互联密度提升带来的价值重估机遇 [9][10]
豆包出“王炸”!AI手机能否成为新的主线?——道达投资手记
每日经济新闻· 2025-12-01 18:28
豆包手机助手产品发布 - 字节跳动通过发布豆包手机助手技术预览版正式切入端侧AI赛道,该产品并非独立手机,而是与手机厂商在操作系统层面合作的AI助手,首发搭载于中兴nubia M153工程样机,售价3499元,主要面向开发者与科技爱好者少量发售[1] - 公司明确表示没有自研手机计划,正以"生态合作"形式与多家厂商推进合作,将豆包手机助手整合进不同品牌机型[1] - 产品核心功能包括直接嵌入操作系统底层,支持专属物理按键、语音全局唤醒及悬浮窗交互,可自动执行跨平台任务链,融合视觉理解与语音交互以"读懂"屏幕内容,并具备操作手机系统的权限及本地化记忆功能[1][2] 豆包手机助手潜在影响 - 该产品可能颠覆应用生态,架空传统App入口,使各类应用降级为被调用的服务模块,冲击现有互联网流量分配格局[2] - 手机端侧AI发展驱动硬件升级,有望成为新一轮换机潮核心推力,AI正从辅助交互工具向"具身智能体"转变,应用场景延展至多模态理解、内容生成和个性化生产力等高价值任务[6] A股市场表现 - A股三大指数集体上涨,上证指数上涨0.65%收复3900点,深证成指上涨1.25%,创业板指数上涨1.31%,沪深两市成交额达到18739亿元,较上一交易日放量2881亿元[3] - 整个市场有3398只个股上涨,1872只个股下跌,个股涨跌幅中位数为上涨0.46%[4] 消费电子及AI硬件板块 - 消费电子方向领涨,AI手机、AI PC、AI眼镜等分支板块涨幅居前,主要受豆包手机助手发布的催化,中兴通讯是AI手机方向核心股,行情可能扩散至AI眼镜、AI音箱等端侧及算力、端侧芯片环节[5] - AI硬件方向核心股中际旭创大幅上涨,带动光模块、PCB方向反弹,该股是AI硬件及趋势方向的锚,其股价稳定对板块结构性行情至关重要[8] - 谷歌产业链方面,基于供应链端排查,摩根士丹利将谷歌TPU在2027年产量预测从约300万块上调至约500万块,增幅约67%[9] 其他行业板块动态 - 国产算力在"超节点"架构变革下崛起,该架构驱动交换芯片、光模块等需求指数级爆发,国内AI算力投入较海外仍有巨大提升空间[10] - 有色板块走强,受国际金银价格上涨、LME铜创历史新高及美联储12月降息概率达80%影响[10] - 大消费方面,旅游、酒店餐饮板块受峨眉山A回馈股东活动及中国中免大涨影响走强,影视院线股因《疯狂动物城2》票房高涨而走势分化[10] - 商业航天板块指数跳空上涨但内部分化,中期基于产业趋势值得关注[10]
AI人工智能ETF(512930)涨超2%,豆包手机助手技术预览版发布
新浪财经· 2025-12-01 14:02
市场表现 - 中证人工智能主题指数(930713)于2025年12月1日强势上涨2.05% [1] - 成分股北京君正(300223)大幅上涨14.95%,乐鑫科技(688018)上涨6.98%,润泽科技(300442)上涨5.93% [1] - AI人工智能ETF(512930)上涨2.00%,最新价报2.09元 [1] 行业驱动事件 - 字节跳动豆包团队发布豆包手机助手技术预览版,该助手是与手机厂商在操作系统层面合作的AI软件 [1] - 豆包明确表示没有自研手机计划,正以"生态合作"形式与多家手机厂商洽谈整合 [1] - 目前可在豆包与中兴合作的工程样机nubia M153上体验技术预览版本 [1] 算力基础设施架构演进 - AI大模型向万亿参数、多模态及智能体加速演进,推动算力基础设施向"超节点"架构跃迁 [2] - 以NVL72为代表的方案通过高带宽、低延迟互联提升训练效率与推理吞吐量 [2] - 架构变革驱动交换芯片、光模块及高速线模组需求从线性增长转变为指数级爆发 [2] 国内AI算力发展前景 - 当前国内AI算力投入较海外仍有巨大提升空间 [2] - 超节点架构被视为国产算力建设实现后发赶超的必经之路 [2] - 云厂商与设备商正加速推进开放协议的适配,互联密度提升带来价值重估机遇 [2] 指数与ETF构成 - 中证人工智能主题指数选取50只为人工智能提供基础资源、技术及应用支持的上市公司证券作为样本 [2] - 截至2025年11月28日,指数前十大权重股合计占比63.92% [3] - 前三大权重股包括中际旭创(300308)、新易盛(300502)、寒武纪(688256)等 [3]
华为超节点:用「一台机器」的逻辑,驱动AI万卡集群
机器之心· 2025-09-19 21:23
超节点架构创新 - 华为基于自研灵衢互联协议创新超节点架构 重新定义大规模有效算力新范式[3][12] - 超节点通过多机物理组合实现逻辑单一设备 统一通信协议与内存编址实现全局资源池化[9] - 架构将通信时延降至百纳秒级 解决传统集群因带宽不足和时延大导致的算力利用率下降问题[5][11] 技术突破与性能表现 - 超节点采用UB-Mesh递归直连拓扑 支持8192卡无收敛全互联 总互联带宽达16PB/s(超全球互联网峰值带宽10倍)[20] - FP8算力达8E FLOPS 支持百万卡规模集群 成为全球最强算力集群之一[20] - 在万亿模型训练中减少40%通信等待时间 显著提升集群利用率和系统可靠性[5][11] 产品矩阵覆盖全场景 - Atlas 950/960 SuperPoD支持8192/15488张昇腾卡 采用全液冷和零线缆电互联设计 解决高密度散热和跨柜部署难题[17][19] - Atlas 850为业界首款企业级风冷超节点服务器 支持1024卡集群 降低企业部署门槛[21] - Atlas 350标卡通过4个灵衢端口实现多卡互联 推荐推理性能提升2.5倍[24] - TaiShan 950 SuperPoD将超节点扩展至通用计算领域 支持数据库和大数据等低延迟场景[25] 生态战略与落地进展 - 推行硬件开放与软件开源战略 将NPU模组和昇腾CANN等核心组件开源[27][28] - 基于灵衢的Atlas 900 A3超节点已累计部署300多套 服务20余个行业客户[28] - 生态覆盖互联网、金融、运营商、电力及制造等多行业[28]
周末密集大动作,多家头部公司加码芯片
选股宝· 2025-09-01 07:16
半导体行业并购与增持动态 - 华虹公司拟通过发行股份及支付现金方式收购华力微97.5%股权并募集配套资金 [1] - 东芯股份拟以自有资金约2.11亿元增资上海砺算(GPU芯片研发设计) 持股比例将达35.87% [1] - 中芯国际筹划发行A股购买控股子公司中芯北方的少数股权 [2] AI芯片国产化进程与政策支持 - AI芯片作为AI产业链基础层 直接决定AI系统计算能力与效率 是上游核心领域 [2] - 2025年美国对AI芯片限制进一步加强 国产芯片支持政策推出 推动国产化进程加速 [2] - 中国芯片自给率稳步提升但仍亟待提高 [2] 国产芯片技术优化与性能提升 - DeepSeek V3.1使用UE8M0 FP8 Scale参数精度 针对下一代国产芯片特别优化设计 [2] - 下一代模型预计在chiplet架构下实现芯片性能大幅提升 超节点架构下MoE性能大幅提升 软硬协同进一步增强(如对FP8原生支持) [2] - 国产芯片从"能用"变为"好用" 昇腾910下一代芯片性能逼近主流国际水平 [2] 二线GPU厂商与产业链机会 - 二线GPU厂商市场空间显著打开 [2] - 超节点相关弹性较大 包括cabletray铜连接 国产交换芯片 全光方案下的光模块 OIO等 [2] 半导体设备龙头企业 - 北方华创 中微公司 芯源微 拓荆科技 盛美上海 华海清科 中科飞测 京仪装备为半导体设备龙头 [3]
超节点,凭何成为AI算力“新宠”?
21世纪经济报道· 2025-07-31 09:00
超节点技术发展背景 - AI大模型发展推动算力需求进入"万卡协同"时代,传统算力架构难以满足高效、低耗、大规模协同需求 [1] - 英伟达率先提出超节点(SuperPod)概念,作为Scale Up最优解,通过高速总线互连加速GPU参数交换和数据同步 [1] - 2025世界人工智能大会展示中国企业在超节点领域突破,如华为昇腾384超节点首秀和曦智科技光互连方案获奖 [1] 超节点技术优势 - 超节点采用Scale Up方案,相比传统Scale Out在性能、成本、组网、运维等方面更具优势 [2] - 通过深度整合GPU资源构建低延迟、高带宽的统一算力实体,提升算力密度和能源效率(PUE) [2] - 采用液冷等先进散热技术,解决高功耗GPU服务器散热和供电挑战,单机柜可整合数十至上百计算单元 [2] 超节点连接方案 - 铜连接成为主流方案,224G以太网SerDes技术实现短距离高性价比传输,GB200 NVL72服务器单机柜使用5000多条电缆总长近2英里 [3] - 超节点方案分为私有协议(英伟达、华为等)和开放标准(ODCC主导的ETH-X项目)两种技术路线 [3][4] - ETH-X架构分为Scale Up(负责HBD内部GPU互联)和Scale Out(扩展多HBD组成集群)两部分 [4] 中国企业布局 - 华为发布昇腾384超节点,实现384卡高速总线互联,具备超大带宽、超低时延优势 [5] - 曦智科技联合壁仞科技推出全球首个分布式光互连光交换GPU超节点方案LightSphereX [5] - 燧原科技云燧ESL超节点系统单节点支持64卡全带宽互联,采用液冷方案 [5] - 摩尔线程构建全栈AI智算产品线,自研KUAE计算集群实现上千节点高效协作 [6] - 沐曦发布曦云C600 GPU支持MetaXLink超节点扩展技术,内置安全防护模块 [5] 市场前景 - 中信建投研报指出超节点已成为下一代服务器方案趋势,铜连接市场空间将随字节、阿里、腾讯采用而扩大 [4] - 行业认为中国超节点技术正为全球AI发展铺设兼具性能与包容性的新赛道 [6]
华丰科技(688629):高速连接国产先锋,受益AI短距互联
华泰证券· 2025-07-04 20:41
报告公司投资评级 - 首次覆盖华丰科技并给予“增持”评级,目标价 59.86 元/股,基于 26E 75xPE 估值 [1][6] 报告的核心观点 - 华丰科技是国内高速连接器领军者,在国内 AI 持续投入叠加海外 GPU 供应受限背景下,国产算力放量或带来可观的集群内短距互联需求,公司为大客户开发的高速线模组产能逐步释放,有望持续兑现业绩增长;“十四五”收官,军费预算增长下公司防务订单有望向好,工业板块收入预计在新能源车高压趋势下实现稳健增长,CPU Socket、无人机系统连接方案等新产品远期或逐步导入市场 [1] 各部分总结 报告核心要点 - 华丰科技是国内领先的光电连接器及互连方案供应商,专注通讯、防务、工业三大领域,拳头产品“高速背板连接器”打破海外垄断;2024 年净亏损因高速线模组未形成产能规模,1Q25 业绩迎来拐点,未来看好高速线模组逐季兑现业绩增量 [15] - 通讯板块与大客户深度合作,受益于 AI 集群内部短距互联需求增长,2029 年国内高速背板连接器市场规模有望达 241 亿元,2025E - 2029E 市场空间 CAGR 为 45%,公司有望持续扩充产线、增加份额 [16] - 防务板块把握“十四五”强军计划收官机会,2025 年国家军费预算同比提升 7.2%,公司已建立系统互连产品优势,防务订单有望向好 [17] - 工业板块新能源高压连接线束深挖客户价值,系统级连接方案应用有望外拓,2026 年我国新能源高压连接器市场有望达 337 亿元,5 年 CAGR 为 42%,轨道交通板块收入有望稳健成长,其他应用场景未来或逐步兑现收入增长 [18] - 市场担忧超节点架构下铜连接使用量减少,但超节点架构创造短距互联场景,铜连接在短距场景相比光连接有稳定性高、成本低、功耗低的优势,使用量或提升 [19] - 截至 2025 年 7 月 3 日,公司股价相比上市日上涨 232%,同期科创 50 上涨 97%,上市 2 年间股价上涨主要受国产算力板块带动和业绩边际改善驱动 [21] 华丰科技:中国高速铜互联领军者,通讯、防务、工业三轮驱动 - 公司成立于 1958 年,是国内领先的光电连接器及互连方案供应商,客户覆盖国内外头部厂商,“高速背板连接器”实现 56Gbps/112Gbps 单通道速率批量生产和 224Gbps 产品开发预研,打破海外垄断 [25] - 公司发展历程分为三个阶段:1958 - 2003 年引进标准,追随苏美步伐;2004 - 2018 年自主创新,三轮驱动初显;2019 年至今突破封锁,引领国产高端连接器市场 [28] - 公司实控人为绵阳市国资委,下游核心客户华为、中兴间接持股,华为哈勃入股;高管管理和技术经验兼备,核心技术人员多为内生培养 [29][31] - 公司业务矩阵聚焦“一核”通讯连接器、“两翼”防务连接器/工业连接器,实现多速率覆盖,各板块产品技术指标先进,客户覆盖广泛 [33] - 2024 年公司收入稳健增长,研发资源投入前置/产能未充分释放致盈利承压;受益于高速线模组产能释放,1Q25 收入和利润边际改善;主营业务通讯板块营收占比有望持续提升;近三年综合毛利率先升后降,防务板块毛利贡献突出但远期毛利率或下行,通讯板块新品毛利率未达稳态;2024 年整体费用率波动不大,2025 年费用率有望优化,研发费用或持续提升 [34][35][41] 连接器行业 - 连接器是电子电路连接桥梁,按传输介质分为电、光、微波射频、流体连接器,华丰科技主要聚焦电/光连接器;产业链分为上游材料、中游制造和下游应用,公司处于中游制造核心环节;2024 年中国连接器市场规模达 280 亿美元,居全球第一,通信和汽车是应用最广的领域 [51][54][63] 通讯连接器 - 通讯连接器用以实现通信设备内部稳定信号传输,华丰主攻高速背板连接器,包括背板、I/O、近芯片连接等形式 [65] - 通讯连接器呈现高速化趋势,AI 服务器内 GPU 算力和带宽升级倒逼连接器单信号速率提升,如英伟达 NVLink 和华为 HCCS 技术的发展 [67][68] - 全球超节点架构兴起,高速铜连接在短距场景有优势,英伟达 GB200 NVL72 和华为 CM384 超节点架构有望拉动高速铜连接市场增长,预计 2029 年国内高速背板连接器市场规模达 241 亿元,2025E - 2029E 市场空间 CAGR 为 45% [74][77][87] - 过往海外公司在高速连接器领域构筑专利壁垒,占据大部分市场;华丰科技高速产品迭代速率追上海外龙头,已成长为华为核心供应商,国内厂商在 112Gbps 及以上产品研制中迎头赶上,有望受益国内算力建设 [90][95] 防务连接器 - 防务装备数量及智能化、集成化水平提升将带动防务连接器量价齐升,2025 年国防支出扩容或催生更多连接需求,2026 年我国军用连接器市场规模有望达 236 亿元 [103][104] - 公司防务板块业务包括系统互连产品、单一防务连接器以及组件等,部分系统互连产品达国际先进水平,单一连接器相关技术达国内同行业头部企业水平,公司具备丰富的重点装备型号定制开发和配套经验,未来有望受益我国防务连接器需求增长 [106][111][112] 工业连接器 - 轨道交通连接器方面,铁路固定资产投资回暖,2025 年我国铁路连接器市场规模有望达 47 亿元,华丰在铁路机车连接器领域份额领先,2023 年市场份额为 24% [114][118] - 新能源连接器方面,汽车连接器分为低压、高压、高频高速等形式,华丰主攻高压连接器;新能源汽车渗透率提升叠加 800V 高压化趋势,高压连接器有望量价齐升,预计 2026 年全国新能源汽车高压连接器市场规模达 337 亿元,5 年 CAGR 为 42%;公司跟进厂商高压化步伐,提供整体解决方案,未来希望开拓高频高速连接器市场 [121][123][133] 盈利预测与估值 - 预计公司 2025 - 2027 年营业收入分别为 24.06/32.10/39.48 亿元,同比增速分别为 +120.3%/+33.4%/+23.0%,归母净利润分别为 2.43/3.67/4.82 亿元,同比增速分别为扭亏/+51.1%/+31.3% [134] - 通讯板块未来业绩有望持续兑现,有客户拓展和品类拓展逻辑,预计 2025 - 2027 年收入为 17.36/24.16/30.21 亿元,同比增速分别为 +227.6%/+39.1%/+25.1%,毛利率分别为 25.35%/26.09%/26.26% [134][135][136] - 防务板块预计 2025 - 2027 年收入为 3.61/4.26/5.03 亿元,同比增速分别为 15.0%/18.0%/18.0%,毛利率分别为 41.0%/41.0%/41.0% [137] - 工业板块预计 2025 - 2027 年收入为 2.89/3.47/4.01 亿元,同比增速分别为 +25.6%/+20.0%/+15.6%,毛利率分别为 15.9%/15.7%/15.5% [138] - 预计 2025 - 2027 年销售费用率分别为 3.20%/3.00%/2.80%,管理费用率分别为 6.40%/6.00%/5.20%,研发费用率分别为 5.90%/5.00%/4.80% [139] - 采用分部估值法,通讯板块选取长芯博创、兆龙互连、软通动力为可比公司,给予 26 年 PE 87x,对应市值 247.99 亿元;其他板块选取瑞可达、鼎通科技、陕西华达为可比公司,给予 26 年 PE 34x,对应市值 27.96 亿元;给予公司 26 年目标市值 275.95 亿元,对应目标价 59.86 元/股,对应 26 年 PE 倍数为 75.13x,首次覆盖给予“增持”评级 [141][142][146]
从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
AI前线· 2025-05-22 12:30
模型开发趋势 - 模型开发从算法层优化转向系统工程层面的深度创新 [1] - 行业从数字化时代的比特流量转向Token经济体系,国内Token日消耗量从千亿级跃升至十万亿级 [1] - 头部平台如DeepSeek日均处理6000亿Token,验证高吞吐、低时延系统的商业价值 [1] - 模型结构从单一架构探索发展为多模态融合创新,分布式集群部署成为新常态 [1] - ChatGPT和DeepSeek用户规模突破亿级的时间从1个月压缩至7天,系统处理能力实现数量级提升 [1] 华为对DeepSeek的优化 - 华为针对DeepSeek的优化包括预训练、算子层面、计算与通信优化、内存优化等方面 [3][6][7][10] - 预训练方面,华为复现并改进DualPipe技术,最终提出DualPipe-V方案,优化显存使用并集成至MindSeed [6] - 算子层面实现MRN的PO融合算子,提升执行效率 [7] - 计算与通信优化包括低时延通信优化和双链路通信掩盖 [7] - 内存优化方面,华为自研重计算技术,节省多个GB显存,适用于计算量小但激活值大的操作 [10] 推理优化与系统架构 - 华为提出PD(Prompt Decoder)分离部署,降低首token延迟并提升整体推理效率 [12] - 针对MOE架构,华为研发"超节点"架构,通过高速总线将上百张GPU卡互联,显著减少通信时延 [14] - 超节点架构采用统一内存编辑和语义通信,实现TB级带宽超高速互联 [14] - Atlas 900 A3 SuperCluster突破Scale up物理节点计算瓶颈,训练效率提升2.7倍 [15] - 在A3超节点集群上完成DeepSeek V3训练优化,达到每卡1,216 TPS吞吐率,MFU达44.57% [15] MOE架构与负载均衡 - MOE架构专家数量不断增加,DeepSeek V3/R1已有288个专家 [13] - 华为引入动态专家并行策略,取代传统张量并行,规避显存和计算浪费 [17] - 通过静态、分段及动态均衡负载算法,解决专家并行带来的负载均衡问题 [17] - 华为发布OmniPlacement算法,识别热/冷专家,优化计算均衡,理论上降低10%推理延迟并提升10%吞吐量 [19]