仿真

搜索文档
应急救援“高科技”亮相广东安全宣传咨询日活动
南方日报网络版· 2025-06-17 16:01
6月16日,广东省、广州市2025年"安全宣传咨询日"活动在广州举行,活动现场共设置应急装备展示 区、社会应急救援力量演练区、12350直播间等9大区域,集中展示广东新质能力应急装备以及安全宣传 教育、基层应急管理能力建设实践及成果。 AR头盔、四足机器狗、可以飞的救生艇……在设备展示区,一批批"高精尖"应急救援设备吸引众多观 众驻足观看。此次活动现场共有参展企业1017家,展示设备及器材多达4000多款。 今年现场还设立了"12350"安全生产非法违法行为现场举报点。"线索主要跟日常生活息息相关,比如消 防通道被占用、电动车违规进楼入户等。"负责接听举报热线的主播介绍,接到举报后,导播会详细记 录问题,形成问题清单,建立追踪档案,并与相关部门沟通,直到获得明确的处置回应。 启动仪式上,省市安委会相关负责人强调,要以开展"安全生产月""安全宣传咨询日"活动为契机,做好 安全宣传进企业、进农村、进社区、进学校、进家庭,普及应急管理法规政策和安全知识。要广泛发动 社会公众参与,鼓励企业职工报告内部的风险隐患,鼓励群众反映身边的安全问题,由"要我安 全"向"我要安全"转变。 16日上午,结合安全宣传进化工园区、进企 ...
华为“数字化风洞”小时级预演万卡集群方案,昇腾助力大模型运行“又快又稳”
第一财经· 2025-06-11 20:12
大模型训推系统的效率挑战 - 超过60%的算力浪费在硬件资源错配与系统耦合上,传统优化方法难以解决芯片特性的"三角矛盾"(算力-带宽-容量失衡)[1] - 大规模训练集群存在利用率黑洞,MoE模型需要精准平衡计算与内存配比,极致压缩通信占比,否则效率骤降[3] - 动态实时推理系统任务两极分化,需同时满足高吞吐与低延迟,在不同任务场景实现动态效率最优[3] 数字化风洞技术 - 在虚拟环境中"彩排"AI模型训推,模拟不同参数、输入和资源分配方案,提前发现计算系统瓶颈点和逻辑漏洞[2] - 华为构建昇腾"数字化风洞",能够小时级预演万卡集群方案,通过性能加速与高可用性实现大模型"又快又稳"运行[2] - 动静态融合的大规模训练集群建模仿真方法,通过有向无环图精准刻画模型对计算、内存、通信的需求[7] Sim2Train训练集群优化 - 通过全量部署空间搜索、动态性能感知调度优化等技术释放算力潜能,实现并行配置、内存管理等小时级自动寻优,支撑MFU达成41%[4] - 负载-软件-硬件协同优化范式发现最优设计与优化方案,包括模型结构智能搜索、全栈架构建模与策略联合优化等[7] - 实现毫秒级资源再平衡与故障容错,保障作业万级小时无间断运行[3] Sim2Infer推理系统优化 - 通过推理服务多层级量化建模、动态智能优化等技术,实现高性能动态专家激活、自适应混合精度推理等,端到端推理性能提升30%+[5] - 构建多层次推理系统建模仿真,集成负载特征建模、层次化系统架构分析等五大核心功能模块[10] - 通过多维代价模型建模实现软硬件协同推理加速创新,在昇腾平台上综合实现推理性能提升30%+[10] Sim2Availability高可用架构 - 通过随机优化搜索、灵敏度分析等技术实现集群硬件架构可靠性瓶颈定位及优化,支撑万卡集群分钟级快恢,可用度达成98%[9] - 硬件故障模式全栈监控,通过马尔科夫链刻画系统随机行为,构建状态转移模型[9][11] - 软件统一协同管控仿真,通过动态规划弹性调度、极致去冗余并行掩盖优化等技术提升算力系统可用度[11] 未来发展方向 - 随着新型应用快速变化和系统架构持续创新,算力基础设施的架构设计与优化空间持续激增[12] - 需要深化负载自动图化建模、多维架构耦合仿真等关键技术,在系统瓶颈分析、最优部署策略求解等领域发力[12] - 推动国产算力基础设施建设与AI计算技术创新,助力华为昇腾集群高效平稳运行[12]
昇腾“数字化风洞”问世:让AI算力配置从经验驱动迈向建模驱动
21世纪经济报道· 2025-06-11 20:05
大模型训推系统的挑战与优化 - 大模型训推系统面临硬件资源错配与系统耦合问题,超过60%的算力浪费在这些方面 [1] - 传统优化方法难以解决芯片特性的"三角矛盾"(算力-带宽-容量失衡) [1] - 动态负载需求下存在软硬件博弈的三大挑战 [2] 数字化风洞解决方案 - 采用"先模拟后实战"方式,在虚拟环境中预演复杂AI模型的表现 [3] - 华为构建昇腾"数字化风洞",能小时级预演万卡集群方案 [3] - 通过Sim2Train实现训练集群架构仿真与设计空间自动寻优,支撑MFU达成41% [3] 训练集群优化 - 大规模训练集群存在利用率黑洞问题,MoE模型需要精准平衡计算与内存配比 [5] - 通过动静态融合的建模仿真方法,快速精准扫描模型对计算、内存、通信的需求 [6] - 实现负载-软件-硬件协同优化,达成模型性能与功能能力的最优均衡 [6] 推理系统优化 - 推理系统任务呈现两极分化,需同时满足高吞吐与低延迟 [5] - 通过Sim2Infer实现推理系统架构仿真与运行时在线自优化 [5] - 端到端推理性能提升30%+,实现高性能动态专家激活和自适应混合精度推理 [7] 高可用架构 - 通过Sim2Availability实现高可用架构仿真与统一协同管控 [9] - 支撑万卡集群分钟级快恢,可用度达成98% [9] - 采用随机优化搜索、灵敏度分析等技术实现集群硬件架构可靠性优化 [9] 未来发展方向 - 新型应用快速变化推动系统架构持续创新 [11] - 需要建模仿真方法支撑算力基础设施持续演进 [11] - 深化负载自动图化建模、多维架构耦合仿真等关键技术 [11] 多层级推理系统 - 构建负载生成-请求调度-推理引擎-硬件系统四层架构 [12] - 集成五大核心功能模块实现复杂推理建模仿真 [12] - 通过软硬协同实现推理性能提升30%+ [12] 故障监控与恢复 - 采用马尔科夫链刻画系统随机行为,构建状态转移模型 [13] - 通过蒙特卡洛分析硬件可靠性瓶颈 [13] - 实现动态规划弹性调度和极致去冗余并行掩盖优化 [13]
华为「数字化风洞」小时级预演万卡集群方案,昇腾助力大模型运行「又快又稳」
雷峰网· 2025-06-11 19:00
昇腾建模仿真平台 - 业界首次发布昇腾建模仿真平台,实现负载-优化策略-系统架构联动寻优,找到基础设施运行甜点 [1] - 华为研究团队发现超过60%的算力浪费在硬件资源错配与系统耦合上 [2] - 传统优化方法在芯片特性的"三角矛盾"(算力-带宽-容量失衡)前束手无策 [2] 大模型训推系统挑战 - 大规模训练集群利用率黑洞:大模型训练过程像"猛踩油门",MoE模型需精准平衡计算与内存配比 [4] - 动态实时推理系统任务两极分化:需同时满足高吞吐与低延迟,在不同任务场景实现动态效率最优 [4] - 复杂万卡集群长稳运行需突破计算-内存动态博弈、异构任务资源争抢及硬件耐久性瓶颈 [4] 数字化风洞解决方案 - 在虚拟环境的"数字化风洞"中预演AI模型训推,提前发现计算系统瓶颈点和逻辑漏洞 [6] - 华为马尔科夫建模仿真团队构建昇腾"数字化风洞",能够小时级预演万卡集群方案 [6] - 通过昇腾亲和的性能加速与训推系统极致高可用,助力大模型运行"又快又稳" [6] Sim2Train训练仿真系统 - 实现并行配置、内存管理、系统亲和通信策略小时级自动寻优,支撑MFU达成41% [7] - 通过有向无环图的算子组合,灵活表达大规模AI应用,快速精准扫描模型资源需求 [7] - 依托负载-软件-硬件协同优化范式,发现最优设计与优化方案 [7] Sim2Infer推理仿真系统 - 实现高性能动态专家激活、自适应混合精度推理等,端到端推理性能提升30%+ [8] - 构建负载生成-请求调度-推理引擎-硬件系统四层架构的复杂推理建模仿真系统 [10] - 通过软硬协同建模仿真驱动推理系统创新优化,综合实现推理性能提升30%+ [10] Sim2Availability高可用仿真 - 实现集群硬件架构可靠性瓶颈定位及优化,支撑万卡集群分钟级快恢,可用度达成98% [11] - 高效精准构建集群系统对计算、存储、网络的"状态监控",通过马尔科夫链刻画系统随机行为 [13] - 通过动态规划弹性调度、极致去冗余并行掩盖优化等技术,实现算力系统可用度显著提升 [13] 未来发展方向 - 随着新型应用快速变化和系统架构持续创新,算力基础设施架构设计与优化空间持续激增 [16] - 华为将继续深化负载自动图化建模、多维架构耦合仿真等关键技术 [16] - 在系统瓶颈分析、最优部署策略求解、架构设计空间探索等领域发力 [16]
训推大模型,为何应该先彩排?
虎嗅APP· 2025-06-11 18:39
通用人工智能(AGI)发展路径 - 单点技术演进边际效应递减,系统性能天花板转向系统工程上限,需通过系统工程创新实现整体效能最优[1] - 华为推出《华为技术披露集》系列,首次全面详述技术细节,旨在构建开放协作生态系统助力昇腾生态发展[1][2] 大模型训推系统核心挑战 - 超过60%算力浪费在硬件资源错配与系统耦合上,传统优化方法难以解决算力-带宽-容量失衡的"三角矛盾"[3] - 大规模训练集群存在利用率黑洞,MoE模型需精准平衡计算与内存配比,通信占比压缩不当会导致效率骤降[5] - 动态实时推理系统需同时满足高吞吐与低延迟,万卡集群需实现毫秒级资源再平衡与故障容错保障长稳运行[6] 破局方案:"数字化风洞"技术 - 采用虚拟环境预演技术,小时级预演万卡集群方案,通过性能加速与高可用设计实现大模型"又快又稳"运行[7][8] - Sim2Train训练仿真系统实现并行配置、内存管理等自动寻优,支撑MFU达41%,算力潜能释放显著[8][9] - 动静态融合建模仿真方法通过有向无环图精准刻画计算/内存/通信需求,结合硬件刻画能力实现效率优化[9][10] 推理系统性能优化 - Sim2Infer推理仿真系统实现动态智能优化,端到端推理性能提升30%+,支持低延迟高吞吐部署[12][13] - 多层级建模仿真系统集成负载特征建模、离散事件驱动仿真等五大模块,实现软硬件协同加速创新[12][13] 高可用集群保障技术 - Sim2Avaliablity高可用仿真实现万卡集群分钟级快恢,可用度达98%,硬件可靠性瓶颈定位精准[15][16] - 马尔科夫链构建系统状态监控模型,结合蒙特卡洛分析实现故障随机模拟与集群硬件可控[16] 未来技术演进方向 - 新型应用如细粒度MoE、Agentic AI等驱动系统架构创新,需建模仿真支撑算力基础设施持续演进[18][20] - 华为将持续深化负载自动图化建模、多维架构耦合仿真等关键技术,推动国产算力基础设施建设[20]
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
雷峰网· 2025-06-09 21:37
算力集群技术演进 - AI算力集群通过连接上万台计算机形成"算力航空母舰",解决大模型训练中的协同工作、故障恢复等世界级难题 [3] - 万卡集群可用度达到98%,实现训练+推理场景下的秒级快速恢复 [1] 超节点高可用技术 - 采用系统层/业务层/运维层三级容错方案,将故障转为亚健康问题并通过运维手段消除 [5] - 系统层通过超时代答欺骗OS和网络路由切换防止超节点级故障 [5] - 业务层实现租户无感知的网络闪断重试,运维层通过主动感知技术削减亚健康事件影响 [6] 集群线性度优化 - 华为提出TACO、NSF、NB、AICT四项关键技术,实现算力规模与性能的近似线性增长 [8] - 实测Pangu Ultra 135B模型在4K卡集群线性度达96%,718B MoE模型在8K卡集群线性度95.05% [8] 万卡训练恢复技术 - 采用进程级重调度恢复技术将训练中断恢复时间缩短至3分钟内 [12] - 进程级在线恢复技术针对硬件UCE故障实现30秒内恢复,算子级在线恢复实现通信算子秒级重执行 [12] MoE模型推理容错 - 大EP组网架构下提出三级容错方案,实例恢复时间从20分钟降至5分钟 [14][15] - TOKEN级重试技术实现30-60秒实例恢复,减卡弹性恢复技术实现用户无感知的秒级恢复 [15] 故障诊断体系 - 构建全栈可观测能力,包含集群运行视图、网络链路监控等模块 [17] - 故障诊断覆盖全栈故障模式库、跨域诊断、计算节点诊断等维度 [17] 建模仿真平台 - 马尔科夫建模仿真平台实现训练吞吐提升4.5%-8.24%,通信暴露时间降低89.84% [20] - 推理建模仿真平均误差低至6.6%,高可用建模实现全周期故障场景仿真 [21] 框架迁移方案 - MindSpore通过MSAdapter工具覆盖90%以上PyTorch接口,实现第三方框架无缝迁移 [23] - 推理阶段支持HuggingFace权重一键部署,盘古72B模型实现推理性能提升 [23] 行业发展趋势 - 算力基础设施将形成"应用需求→硬件创新→工程反哺"的闭环演进路径 [25] - 未来方向包括算法驱动算力专用化、光电混合架构革新、AI智能化运维等 [25]
让算力航母稳健远航,华为首次披露昇腾算力基础设施的压舱石
21世纪经济报道· 2025-06-09 20:08
( 3 ) Sim2Av a il abilit y高可用建模仿真: 马尔科夫高可用建模仿真框架,通过离散时间步长 仿真,建模单步时长内的故障性能劣化影响与恢复耗时,模拟复杂系统训练任务中的故障场 景及运维响应,实现对训练过程性能表现与故障恢复状态的全周期监控仿真。 建模仿真:算力底座的"数字化风洞" 框架迁移:给模型跑车换更酷炫轮胎 总结与展望 你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译,甚至帮医生看 CT 片,这些能 力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断 进化到能处理万亿参数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而算力集群则是 把上万台甚至几十万台计算机像搭积木一样连接起来,形成一艘能承载巨量计算任务的 "算力航 空母舰"。 当我们把上万台计算机整合成一个有机整体时,需要解决一系列世界级难题:如何让它们像 精密钟表一样协同工作?如何在部分设备故障时依然保持高效运行?如何快速修复大规模训 练中的中断问题?接下来我们将逐一揭秘这些支撑 AI 算力集群的关键特性,看看华为团队如 何用工程智慧驯服这头算力巨兽。 超节点高可用 ...
人形机器人专题:2025具身智能产业发展趋势研究及安全威胁分析报告
搜狐财经· 2025-06-05 04:55
具身智能产业概述 - 具身智能定义为基于物理身体进行感知和行动的智能系统,强调智能行为是身体与环境动态交互的结果[12] - 区别于传统AI,具身智能具备物理交互性、环境适应性和生产力型技能三大特征[13][14] - 主要形态包括类人机器人(如特斯拉Optimus)、仿生机器人(如波士顿动力Spot)和环境嵌入式系统(如达芬奇手术机器人)[15] 技术体系 - 核心技术框架为"感知-决策-行动-反馈"闭环: - 感知模块融合视觉/听觉/触觉等多模态数据,采用CNN等算法实现环境解析[19][20] - 决策模块依托GPT/RT-2等大模型进行任务规划,采用分层或端到端模型架构[21][22] - 行动模块结合机器人学与仿生学技术实现精密运动控制[22][23] - 反馈模块通过强化学习与物联网技术持续优化行为策略[23][24] 全球市场发展 - 2024年市场规模25.335亿美元,预计2033年达87.565亿美元(CAGR 15%)[35] - 美国主导技术生态(特斯拉/英伟达等),欧盟侧重伦理治理,日韩聚焦产业协同[1][37] - 商业模式包括软硬结合整机销售(特斯拉)、API接口收费(英伟达)和垂直领域解决方案(ABB)[36] 中国产业现状 - 2023年市场规模4186亿元,政策从国家到地方分层布局(北京/上海/深圳)[1] - 华为/优必选等企业在大模型和机器人本体领域取得突破[1] - 核心挑战包括高端伺服电机国产化率不足60%、数据采集成本高、标准不统一等[1] 技术发展趋势 - 多模态融合与数据生态标准化加速技术泛化[29] - 仿真平台(如"慧思开物")重塑研发模式[30] - 场景商业化分阶段推进:工业优先(机械臂)、家庭长期培育(服务机器人)[30] - 材料革命推动柔性电子皮肤等新型产品形态[31] 产业链构成 - 上游:传感器/芯片等核心零部件[25] - 中游:机器人本体制造与系统集成[25] - 下游:工业/医疗/物流/家庭等应用场景[25] 安全挑战 - 数实融合攻击可能引发物理系统破坏[32] - 多维度数据采集存在隐私泄露风险[32] - 自主决策事故责任界定困难[33]
连云港虹洋热电公司入选2025年江苏省先进级智能工厂
新华日报· 2025-06-05 04:54
公司入选与背景 - 连云港虹洋热电有限公司入选《2025年江苏省先进级智能工厂名单》,成为全省能源行业智能化建设示范企业[1] - 公司为徐圩新区公用热源点,服务石化产业基地内多家企业,总投资超98亿元[1] - 已建成10炉9机,总供热能力3428.5吨/小时,是徐圩新区最大清洁能源热电联产项目[1] 智能化建设成果 - 以"数据驱动、智能赋能"为核心推进智改数转网联工作,采用人工智能、大数据、物联网等技术构建智能化生产管理体系[1] - 建立统一数据中台架构,实现全厂级数据互联互通,提升安全性和环保水平[1] - "智慧虹洋"一期项目开发煤场控制及皮带巡检智能系统,借助UWB技术构建智能化安全管理体系[2] - 引入高效节能设备和技术,优化生产工艺流程,使能源供给结构更高效环保[2] 行业发展趋势 - 徐圩新区实施智改数转网联行动,加速产业链与创新链、数字链深度融合[2] - 完善智能工厂梯度培育体系(基础级、先进级、卓越级、领航级),助推企业智能化绿色化转型[2] - 搭建专业辅导平台,对重点企业开展"一对一"诊断服务,指导智能装备应用和数据互联互通[2] - 近两年新区已有3家企业获批国家工业互联网试点示范、3家获批国家5G工厂、10家获评省级智能工厂[2]
51WORLD更新招股书:或成「港股数字孪生第一股」,葛卫东、梁伯韬为股东
IPO早知道· 2025-06-02 22:42
上市进程 - 公司于2025年5月30日更新招股书,继续推进港交所主板上市进程,中金公司和华泰国际担任联席保荐人 [2] - 公司以18C章程赴港上市,曾两度考虑在境内交易所挂牌上市,分别于2020年12月备案科创板上市辅导和2023年12月备案北交所上市辅导 [2] 公司业务 - 公司成立于2015年,专注于中国数字孪生行业,聚焦3D图形、模拟仿真和人工智能三大领域技术 [2] - 公司形成三大核心业务:51Aes(数字孪生平台)、51Sim(合成数据与仿真平台)以及51Earth(数字地球平台) [2] - 51Aes是公司当前主要收入来源,提供包括AES、WDP、ISE三个核心产品和51CIM、51WIM、51XIM等行业解决方案 [3] - 51Sim于2017年孵化,核心产品包括SimOne、DataOne和TIM,已为数百家智能驾驶行业客户提供商业化服务 [3] - 51Earth于2022年孵化,截至2025年5月26日已吸引数以千计的建造者和开发者 [4] 行业地位 - 公司是数字孪生行业中首家提出并持续实施地球克隆计划的公司,也是行业唯一能够提供一站式数字孪生解决方案的公司 [4] - 公司是中国数字孪生行业中首家实现一年内收入超2.5亿港元的公司,2023年数字孪生行业中收入排名第一 [4] - 公司在中国数字孪生市场的融资金额排名第一 [4] 客户覆盖 - 公司已向覆盖19个国家及地区的超1000家企业客户提供产品及解决方案,涵盖10多个领域 [4] - 在智能驾驶和交通领域,公司已服务数百家客户,包括主机厂、一级供应商、智能驾驶人工智能公司和大学 [4] - 公司解决方案已提供给超过80家海外客户 [4] 财务数据 - 2022年至2024年,公司营收分别为1.70亿元、2.56亿元和2.87亿元 [5] - 同期公司毛利率分别为65.0%、54.2%和51.0% [5] - 2024年6月完成F轮融资后,公司估值为44亿元人民币 [5] 股东结构 - 公司获得光速光合、云九资本、StarVC、商汤科技等知名机构与上下游合作伙伴投资 [5] - IPO前,光速光合、云九资本以及商汤科技分别持有公司17.3%、3.4%以及2.3%的股份 [5] 募资用途 - IPO募集所得资金净额将主要用于研发计划、提供商业化能力以及用作营运资金及一般企业用途 [5]