盘古Ultra MoE模型

搜索文档
算力军工双轮驱动,助力三大指数飘红
格隆汇APP· 2025-06-05 18:49
一、三大指数集体飘红 6 月 5 日的 A 股市场 ,投资者的目光紧锁在行情大屏 —— 军工股集体爆发与算力板块的强 势拉升形成鲜明对照,而大消费板块的绿线则默默延伸。截至 收盘 ,上证指数微涨 0. 23 % 报 3 384.10 点,深证成指涨 0. 50 % 报 10 203 .5 0 点,创业板指涨 1.17 % 报 20 48.62 点,沪深两市半日成交额 12904 亿元, 相对昨天放量 1374 亿 ,结构性行情正成为 资金博弈的核心战场。 3 、 资金布局聚焦科技主线。两融余额突破 1.8 万亿元大关,单日增长 24.4 亿元,其中东 方财富获融资买入 8.26 亿元,新易盛、中际旭创等 TMT 个股同样获大额融资流入。今日新 发的 9 只基金涵盖混合型与债券型产品,为市场输送增量弹药。游资则围绕连板股展开攻势 —— 滨海能源 13 天 8 板,均瑶健康 8 天 6 板,短线赚钱效应持续激活交投情绪。 四 、后市展望:结构分化延续 当前市场核心矛盾凸显:一方面关税政策扰动推升避险需求,黄金配置价值凸显;另一方面低 利率环境重塑估值体系,高股息化工股(股息率普遍超 6% )与科技成长股形成配置双 ...
华为推出参数规模7180亿全新模型;广东稳居端午档全国“第一票仓”丨大湾区财经早参
每日经济新闻· 2025-06-02 22:49
|2025年6月3日星期二| NO.1华为推出参数规模7180亿全新模型 据"深圳新闻网"6月2日消息,近日,华为在MoE(混合专家模型)训练领域再进一步,推出参数规模高达7180亿的全新模型——盘古 Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。华为同时发布盘古Ultra MoE模型架构和训练方法的技术报 告,披露众多技术细节,充分体现了昇腾在超大规模MoE训练性能上的跨越。 点评:华为不仅完成了"国产算力+国产模型"的全流程自主可控的训练实践,同时在集群训练系统的性能上也实现了业界领先。这意味 着国产AI基础设施的自主创新能力得到了进一步验证。 NO.2 广东稳居端午档全国"第一票仓" 据"广东发布"微信公众号6月2日消息,截至6月1日16时17分,2025年端午档(5月31日—6月2日)全国实时电影票房已突破3亿元,总观 影人次超761万,较去年同期有所上升。广东端午档期内票房超4500万元,继续稳居全国"第一票仓"。 点评:广东是中国最大的电影消费市场之一,观众观影意愿强、消费能力高,影院数量和银幕数量众多,为票房提供了坚实的市场支撑 NO.3 粤港澳大湾区车展前三日预 ...
端午假期要闻速览,本周全球市场大事不断
Wind万得· 2025-06-02 20:35
端午长假结束,假期 12 条新闻有望对节后资本市场产生一定影响。 1 、俄乌新一轮谈判前夕再出 " 黑天鹅 " 俄罗斯伊尔库茨克州州长科布泽夫 6 月 1 日表示,乌克兰方面对斯列德尼镇军事基地发动了无人机袭 击,这是首次有西伯利亚地区的军事基地遭无人机袭击。此外还有无人机投弹击中了新马利廷斯克的一 栋旧建筑。无人机确切数量尚在统计中。科布泽夫称,发射无人机的一辆货运卡车已被发现并封锁。没 有平民在袭击中受伤。 2 、美国贸易代表办公室延长对中国 301 条款关税的部分豁免 当地时间 5 月 31 日,美国贸易代表办公室宣布延长对中国在技术转让、知识产权和创新方面的行为、 政策及做法的 301 调查中的豁免期限。这些豁免原定于 2025 年 5 月 31 日到期,现已延长至 2025 年 8 月 31 日。 3 、特朗普: 6 月 4 日起,进口钢铁关税提高至 50% 当地时间 5 月 30 日,美国总统特朗普表示,将把进口钢铁的关税从 25% 提高至 50% 。美国白宫当天 在社交媒体上发布公告称, " 为进一步保护美国钢铁行业免受外国和不公平竞争的影响,从下周起,美 国进口钢铁关税将从 25% 提高至 5 ...
周观点:AI基建如火如荼,自主可控愈演愈烈-20250601
国盛证券· 2025-06-01 19:38
证券研究报告 | 行业周报 gszqdatemark 2025 06 01 年 月 日 电子 周观点:AI 基建如火如荼,自主可控愈演愈烈 英伟达营收再创历史,推理接力训练推动算力需求。英伟达公布 FY26Q1 业绩, FY26Q1 营收 440.62 亿美元,同比+69%,环比+12%,剔除 H20 费用影响后 non- gaap 毛利率为 71.3%,实现净利润 187.75 亿美元,yoy+26%,qoq-15%。分应 用来看,数据中心领域实现营收 391 亿美元,环比增长 10%,同比增长 73%,游 戏和 AI PC 实现营收 38 亿美元,环比增长 48%,同比增长 42%,专业可视化实 现营收 5.09 亿美元,同比增长 19%,汽车和机器人实现营收 5.67 亿美元。从产 品来看,GB200 NVL 推出旨在实现最低的每 token 推理成本,目前机架出货量已 强劲向终端客户交付,主要超大规模客户每周各部署近1000个NVL72机架。GB300 系统的样品已于本月初在主要云服务提供商处开始测试,预计本季度末开始量产 发货。根据英伟达业绩说明会,推理端需求爆发,OpenAI、微软和谷歌的 tok ...
陆家嘴财经早餐2025年5月31日星期六
Wind万得· 2025-05-31 06:55
2、比亚迪集团品牌及公关处总经理李云飞回应"汽车圈恒大"质疑称,整体来看, 中国主流车企的资产负债情况要好于国外车企,根本不存在所谓的"车 圈恒大",任何唱衰中国新能源汽车的言论都是不可取的。 李云飞表示,比亚迪已向国家有关部门反映及上报了相关证据及线索,对于恶意带节奏的相关 方,将追究其法律责任。 3、《华尔街日报》引述消息人士称, 美国联邦巡回上诉法院暂时恢复特朗普政府的关税措施之际,特朗普团队正在准备"关税B计划"。其中第一步是考 虑根据《1974年贸易法》的一项从未使用过的第122条款,对全球大范围征收关税,包括允许政府在150天内征收高达15%的关税。 第二步是根据第301条 款来加征针对性关税。 4、摩根大通CEO戴蒙在"里根国家经济论坛"警告称, 美国政府和美联储在支出与量化宽松(QE)方面都"过犹不及",债券市场"迟早会出现"裂痕。 1、 美国财长贝森特称美中贸易谈判"有点迟滞",外交部发言人林剑回应称,中方已多次阐明了在关税问题上的立场, 具体问题建议向中方主管部 门询问。 对于美暂停向中国出售发动机技术,对中国进行恶意封锁和打压,中方对此坚决反对, 并将坚决维护自身正当权益。 2、就美国工 ...
华为揭秘:国产昇腾训出世界一流大模型
观察者网· 2025-05-30 16:35
在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上,高效打通大稀疏比MoE强化学习 (RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。同时,在5月初发布的预训练系统 加速技术基础上,在不到一个月的时间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自 适应流水掩盖策略,进一步优化算子执行序,进一步降低Host-Bound以及提升EP通信的掩盖;自适应 管理内存优化策略的开发;数据重排实现DP间Attention负载均衡;以及昇腾亲和的算子优化,这些技 术实现万卡集群预训练MFU由30%大幅提升至41%。 此外,近期发布的盘古Pro MoE大模型,在参数量仅为720亿,激活160亿参数量的情况下,通过动态激 活专家网络的创新设计,实现了以小打大的优异性能,甚至可以媲美千亿级模型的性能表现。在业界权 威大模型榜单SuperCLUE最新公布的2025年5月排行榜上,位居千亿参数量以内大模型排行并列国内第 一。 华为盘古Ultra MoE和盘古Pro MoE系列模型的发布,证明华为不仅完成了国产算力+国产模型的全流程 自主可控的训练实践,同时在集群训练系统的性能上也实现了业界 ...