盘古Ultra MoE模型

搜索文档
算力军工双轮驱动,助力三大指数飘红
格隆汇APP· 2025-06-05 18:49
市场表现 - 上证指数微涨0 23%报3384 10点 深证成指涨0 50%报10203 50点 创业板指涨1 17%报2048 62点 沪深两市半日成交额12904亿元 相对昨天放量1374亿元 [1] - 算力硬件午后强势爆发 青云科技封板涨停 生益电子 德科立 瑞可达等个股涨幅均超15% 带动上证科创板综合指数午盘上涨 [2] - 军工与工业板块掀起涨停潮 建设工业 湖南天雁 东安动力等多只个股早盘封死涨停 装备制造 新材料等工业细分领域多家公司涨停 [2] - 足球概念股延续强势 共创草坪斩获4连板 金陵体育4交易日涨超90% [3] 上涨驱动因素 - 工信部发布《算力互联互通行动计划》 构建"一点接入 全算贯通"的算力互联网体系 国家能源局启动新型电力系统首批试点 推动虚拟电厂市场化 [4] - 英伟达Q1财报验证算力高景气度 市值重返全球第一 利润率预期达80% 华为7180亿参数盘古Ultra MoE模型完成训练 小米发布国内首款3nm芯片 宇树科技举办全球首场人形机器人格斗大赛 [4] - 两融余额突破1 8万亿元大关 单日增长24 4亿元 东方财富获融资买入8 26亿元 新易盛 中际旭创等TMT个股获大额融资流入 新发9只基金涵盖混合型与债券型产品 [5] 市场结构性特征 - 结构性行情成为资金博弈核心战场 军工股集体爆发与算力板块强势拉升形成鲜明对照 大消费板块表现疲弱 [1] - 兵装集团重组进展公告显示 其汽车业务将分立为国务院国资委直接监管的独立央企 为市场注入改革预期 [2] - 当前市场核心矛盾为关税政策扰动推升避险需求与低利率环境重塑估值体系 高股息化工股(股息率超6%)与科技成长股形成配置双主线 [6]
华为推出参数规模7180亿全新模型;广东稳居端午档全国“第一票仓”丨大湾区财经早参
每日经济新闻· 2025-06-02 22:49
华为AI模型突破 - 华为推出参数规模高达7180亿的全新盘古Ultra MoE模型,实现全流程在昇腾AI计算平台训练[1] - 模型为全球首个准万亿级MoE架构,技术报告披露了集群训练系统的性能达到业界领先水平[1] - 该突破验证了国产AI基础设施在"算力+模型"全流程的自主可控能力[1] 广东电影消费市场 - 2025年端午档全国电影票房突破3亿元,总观影人次761万,广东以4500万元票房蝉联全国第一[2] - 市场优势源于观众高消费能力、强观影意愿及密集的影院/银幕资源[2] 粤港澳大湾区车展 - 2025年车展前三日参观人次达45万(同比+27.84%),预计成交额40亿元(同比+8.1%)[3] - 26万平方米展区集中展示汽车产品,激发大湾区高收入群体的消费潜力[3] 香港零售业动态 - 4月零售业总销货价值289亿港元(同比-2.3%),销量同比下滑3.3%,线上销售占比8.1%[4] - 旅游业复苏与内地经济支撑被视作未来零售业回稳的关键因素[4] 深市行情数据 - 深证成指5月30日收报10040.63点(单日-0.85%)[5] - 霍普股份(+19.99%)、睿智医药(+19.98%)领涨,久盛申气(-16.81%)、C古麒(-15.56%)领跌[6]
端午假期要闻速览,本周全球市场大事不断
Wind万得· 2025-06-02 20:35
俄乌冲突动态 - 乌克兰首次对西伯利亚军事基地发动无人机袭击 袭击目标包括斯列德尼镇军事基地和新马利廷斯克旧建筑 无人机确切数量仍在统计中[1] 中美贸易政策 - 美国延长对中国301条款关税豁免期限 从原定2025年5月31日延长至2025年8月31日[2] - 美国将进口钢铁关税从25%提高至50% 新规自6月4日起生效 欧盟表示将采取反制措施[3] 中国经济数据 - 中国5月制造业PMI为49.5% 较上月上升0.5个百分点 大型企业PMI升至50.7% 中型企业降至47.5% 小型企业升至49.3%[4] 矿产资源管控 - 全国多地加强战略矿产出口管控 贵州、湖南、广西等地出台具体措施 包括建立企业台账、加强合规建设、打击非法开采等[5] 新能源汽车行业 - 新能源车行业开启新一轮价格战 工信部表示将整治"内卷式"竞争 中汽协发布四点倡议 包括禁止低于成本价销售等[6][8][9] 能源市场 - OPEC+连续第三个月增产 7月起日均增产41.1万桶 规模与前两次持平[11] 金融政策与市场 - 香港《稳定币条例》正式生效 建立法币稳定币发行人发牌制度[12] - A股多个指数样本将调整 包括沪深300、中证500等 调整将于6月16日生效[13] - 港股宁德时代加入MSCI中国标准和大盘股指数 自6月2日起生效[15] 科技突破 - 华为发布盘古Ultra MoE模型 参数规模达7180亿 为全流程在昇腾平台训练的准万亿模型[14] 全球财经数据 - 多国将公布重要经济数据 包括欧元区CPI、美国非农就业、多国PMI等[16][17][18][19][20][21][22] - 欧洲央行预计将降息25个基点 加拿大、印度、俄罗斯央行也将公布利率决议[25]
周观点:AI基建如火如荼,自主可控愈演愈烈-20250601
国盛证券· 2025-06-01 19:38
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - AI基建火热,英伟达业绩创新高,算力需求强劲,推理端需求爆发将加速AI基建布局,推动算力芯片需求上升,EDA进口受限推动国产崛起,华为盘古Ultra MOE模型亮相,展现技术突破 [1][2] 根据相关目录分别进行总结 英伟达业绩再创历史,AI基建如火如荼 - FY26Q1营收440.62亿美元,同比+69%,环比+12%,净利润187.75亿美元,yoy+26%,qoq - 15%,展望FY26Q2,预计营收450亿美元,上下浮动2% [10] - 数据中心营收391亿美元,环比增长10%,同比增长73%,游戏和AI PC营收38亿美元,环比增长48%,同比增长42%,专业可视化营收5.09亿美元,同比增长19%,汽车和机器人营收5.67亿美元,同比增长72% [11][12][13] - GB200 NVL机架出货量强劲,主要超大规模客户每周各部署近1000个NVL72机架,GB300系统样品已开始测试,预计本季度末量产发货 [15] - 推理端需求爆发,OpenAI、微软和谷歌的token生成量跃升,微软第一季度处理超100万亿个token,同比增长五倍 [17] EDA进口受限推动国产崛起,产业脱钩持续演进 - 2025年5月美国BIS向三大EDA软件厂商发出出口限制通知,Synopsys和Cadence已确认收到信函 [19] - 全球EDA市场2025年规模约174.2亿美元,中国2025年预计达184.9亿元,2020 - 2025年CAGR为14.71% [23] - 美国自2018年以来持续升级对华EDA出口管制政策,全球EDA市场被三大巨头垄断,国内市场三巨头份额超80% [29][31] - 国产EDA厂商通过收并购加速补链,预计2025年国产化率达17%,有望实现全流程覆盖 [35][38] 华为盘古Ultra MOE模型亮相 - 华为推出参数规模达7180亿的盘古Ultra MOE模型,在模型架构和训练方法上有创新 [39] - 模型架构上提出DSSN稳定架构和TinyInit小初始化方法,实现10+T tokens数据的长期稳定训练,还提出EP loss负载优化方法 [39] - 训练方法上首次披露打通大稀疏比MoE强化学习后训练框架的关键技术,万卡集群预训练MFU由30%提升至41% [40] 相关标的 - 谷歌产业链:胜宏科技、天弘科技、lumentum、FINISAR [46] - 海外AI:胜宏科技、工业富联、沪电股份、麦格米特 [47] - 国产算力:中芯国际、寒武纪、海光信息等 [47] - 国产EDA:概伦电子、华大九天、广立微 [48] - 光刻机零部件:茂莱光学、波长光电、福光股份、福晶科技 [49]
陆家嘴财经早餐2025年5月31日星期六
Wind万得· 2025-05-31 06:55
陆家嘴论坛与金融政策 - 2025陆家嘴论坛将于6月18日至19日举行,央行行长潘功胜、副行长朱鹤新将出席并作主题演讲,期间中央金融管理部门将发布若干重大金融政策 [2] - 金融监管总局、证监会、外汇局和上海市政府的领导也将在论坛上发表演讲 [2] 新能源汽车行业动态 - 比亚迪集团品牌及公关处总经理李云飞回应"汽车圈恒大"质疑,称中国主流车企资产负债情况优于国外车企,不存在"车圈恒大" [2] - 比亚迪已向国家有关部门反映相关证据及线索,将追究恶意带节奏方的法律责任 [2] 国际贸易与关税 - 美国联邦巡回上诉法院暂时恢复特朗普政府关税措施,特朗普团队准备"关税B计划" [2] - 计划包括根据《1974年贸易法》第122条款对全球大范围征收高达15%的关税,以及根据第301条款加征针对性关税 [2] - 美国财长称美中贸易谈判"有点迟滞",中方已多次阐明在关税问题上的立场 [3] 金融市场与投资 - 摩根大通CEO戴蒙警告美国政府与美联储在支出与量化宽松方面"过犹不及",债券市场"迟早会出现"裂痕 [2] - 平安资管获批设立私募基金"恒毅持盈",首期基金规模300亿元,重点布局优质上市公司 [5] - 香港"科企专线"市场反应热烈,港交所和香港证监会正推进上市制度优化 [6] 科技与创新 - 华为推出参数规模高达7180亿的盘古Ultra MoE模型,全流程在昇腾AI计算平台训练 [14] - 宇树科技即将发布拥有26个自由度的人形机器人,售价或为数千美元 [15] - 阿里云发布首个AI原生开发环境工具通义灵码AI IDE,深度适配千问3大模型 [15] 消费与零售 - 泡泡玛特旗下IP"Labubu"在全球市场热销,因安全风险暂停在英国的销售 [15] - 瑞幸咖啡推出6.9元优惠券,引发咖啡行业价格战猜测 [16] - 霸王茶姬一季度总净收入33.9亿元,同比增长35.4%,海外市场GMV增长85.3% [20] 房地产与基建 - 一季度末人民币房地产贷款余额53.54万亿元,同比增长0.04% [11] - 1-5月TOP100企业拿地总额4051.9亿元,同比增长28.8%,央国企为主力 [11] - 全国住房公积金2024年缴存额36317.83亿元,发放个人住房贷款13043.07亿元 [11] 制造业与汽车 - 华为与江淮汽车联合打造的超豪华汽车尊界S800发布,售价70.8万-101.8万元 [14] - 5月中国汽车经销商库存预警指数52.7%,同比下降5.5个百分点 [10] - 牧原股份决定不对二次育肥客户出售商品猪 [12] 半导体与电子 - 半导体设计软件公司新思科技告知中国员工停止在华服务和销售,以遵守美国出口限制 [14] - 奕斯伟计算向香港联交所提交上市申请,主要做RISC-V开源架构芯片 [7] - 深圳乐动机器人提交上市申请,为全球最大视觉感知技术为核心的智能机器人公司 [7] 宏观经济数据 - 4月我国国际收支货物和服务贸易顺差462亿美元,对外证券投资资产14173亿美元 [3] - 美国4月核心PCE物价指数同比上涨2.5%,为四年多来最小涨幅 [17] - 印度2025财年第四季度GDP同比增长7.4%,大幅超越经济学家预测 [21]
华为揭秘:国产昇腾训出世界一流大模型
观察者网· 2025-05-30 16:35
华为盘古Ultra MoE模型发布 - 公司推出参数规模高达7180亿的全新模型盘古Ultra MoE 这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型 [1] - 公司发布盘古Ultra MoE模型架构和训练方法的技术报告 披露众多技术细节 体现昇腾在超大规模MoE训练性能上的跨越 [1] - 模型架构采用Depth-Scaled Sandwich-Norm稳定架构和TinyInit小初始化方法 在昇腾平台上实现超过18TB数据的长期稳定训练 [1] - 提出EP loss负载优化方法 保证专家间负载均衡并提升领域特化能力 [1] - 使用业界先进的MLA和MTP架构 在预训练和后训练阶段采用Dropless训练策略 实现模型效果与效率的最佳平衡 [1] 训练方法创新 - 在昇腾CloudMatrix 384超节点上高效打通大稀疏比MoE强化学习后训练框架关键技术 使RL后训练进入超节点集群时代 [2] - 预训练系统加速技术完成迭代升级 包括自适应流水掩盖策略 算子执行序优化 内存优化策略 数据重排等 [2] - 技术升级使万卡集群预训练MFU由30%大幅提升至41% [2] - 盘古Pro MoE大模型参数量720亿 激活160亿参数量 通过动态激活专家网络设计 实现媲美千亿级模型的性能 [2] - 盘古Pro MoE在SuperCLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [2] 行业影响 - 公司完成国产算力+国产模型全流程自主可控的训练实践 [3] - 集群训练系统性能实现业界领先 [3] - 国产AI基础设施自主创新能力得到进一步验证 为中国人工智能产业发展提供支持 [3]