Workflow
华为云CloudMatrix 384超节点
icon
搜索文档
“预见AI”AI技术创新与产业落地系列沙龙首期活动在蓉启幕
搜狐财经· 2025-10-28 19:22
活动概况 - 首期“预见AI”AI技术创新与产业落地系列沙龙于10月28日在成都天府软件园成功举办 [3] - 活动主题为“连接·碰撞·生成 共筑AIGC创新应用新图景” [3] - 活动由华为云、封面传媒科技、成都院士联合会三方联合主办,旨在作为常态化活动持续为区域数字经济注入新动能 [3][15] 行业背景与活动目标 - 四川省人工智能产业蓬勃发展,上半年营收高达926亿元,同比增长31.6%,企业总数超过1500家 [11] - 活动核心目标是弥合前沿技术与实体经济具体场景及成本约束之间的鸿沟,为传统产业和中小企业提供可复制的成功路径 [11][13] - 活动致力于打造高端对话平台,通过深度研讨与案例解析,推动AI技术“走进工厂、融入产线、赋能行业” [13] 主办方角色与技术支持 - 华为云提供昇腾AI云服务和Versatile智能体平台作为技术支撑 [5][15] - 华为云CloudMatrix 384超节点将384颗昇腾NPU和192颗鲲鹏CPU互联,形成超级“AI服务器”,大幅提升算力使用率 [5] - 华为云推出企业级智能体平台Versatile,可将原本需30人天以上的开发工作量缩短至3人天,效率提升10倍以上 [5] - 华为云针对四川企业推出专属算力加速计划,亿万主流模型Tokens可限时免费使用 [6] - 封面传媒科技利用智媒技术与生态资源搭建链接桥梁,帮助企业对接到技术伙伴和产业链资源 [15] 参会企业及解决方案分享 - 活动汇聚了人工智能、软件与信息技术服务、金融与公共服务等三十多家企业代表 [5] - 成都旺小宝科技有限公司为地产、家装、医美等高客单价行业提供以“智能硬件+大模型+多模态+智能体”为核心的销售智能解决方案 [8] - 致远互联推出CoMi智能化产品家族,覆盖办公协同和业务全流程智能化,推动协同全链路从“效率工具”向“智能生态”跨越 [10] 活动展望与生态构建 - “预见AI”系列沙龙将作为常态化活动持续举办,每期聚焦一个特定主题或行业 [3][15] - 活动旨在从单一活动向可持续生态系统跨越,成为连接AI技术创新与产业落地的桥梁和区域数字经济的“催化器” [15]
华为云CloudMatrix 384超节点再出圈,昇腾AI云服务解锁超级算力
观察者网· 2025-07-28 15:15
华为384超节点技术突破 - 华为384超节点真机荣获WAIC 2025"镇馆之宝"奖项,其CloudMatrix 384超节点支持的昇腾AI云服务因弹性灵活按需取用特性成为焦点[1] - 超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过MatrixLink全对等互联,形成算力达300 PFlops的超级AI服务器,突破跨机通信带宽瓶颈[3] - 昇腾AI云服务降低企业使用先进智算门槛,直接提供成熟软件栈和工具链,加速大模型研发与部署[3] CloudMatrix 384超节点技术特点 - 吞吐性能强:单卡Decoding吞吐达2300Tokens,软硬件协同优化[4] - 覆盖160+行业主流模型,高效支撑模型迁移[4] - 国内首创大规模专家并行方案,实现系统级优化,降低decode时延[4] - 初始投资小,每年迭代新版本,弹性按需使用[4] 行业应用案例 - 新浪"智慧小浪"推理效率提升50%以上,硅基流动每日服务600万用户推理[4] - 中科院自研AI4S科研大模型,面壁智能"小钢炮"模型推理性能大幅提升[4] - 360"超级搜索"纳米AI搜索采用该算力,讯飞大模型实现极致推理性能[4] 具身智能与垂直行业解决方案 - CloudRobo具身智能平台结合多模态生成大模型等能力,上海国地中心应用后数据采集成本降低90%[8] - 与北铁所合作铁路大模型及高铁智能巡检机器人,助力中国铝业打造有色金属行业首个大模型"坤安"[10] - "AI+气象"方案提升新能源发电效率,AI工业链赋能智能制造,钢铁热轧实现毫米级控制[10] 智能产品展示与未来规划 - 展区推出智能中医把脉仪、戴盟机器人、内置大模型的鸿蒙电脑等产品[10] - 公司将持续通过"尖刀技术"与垂直解决方案推动AI与产业深度结合[10]
封杀中国芯片?!歇斯底里,黔驴技穷!
半导体芯闻· 2025-05-21 18:29
美国对华为芯片的出口管制措施 - 美国商务部推出激进半导体出口管制措施,核心条款为全球任何国家或企业若使用华为昇腾910系列芯片,均被视为违反美国出口管制规定,最高面临20年监禁和100万美元罚款 [2] - 美国制造的芯片中国AI模型不能用,中国产的芯片其他地方的AI模型也不能用 [2] - 美国商务部公告指责华为昇腾芯片"很可能"使用了美国技术,属于"莫须有"的罪名 [9] 中国官方回应 - 商务部指出美方措施是典型的单边霸凌和保护主义做法,严重损害全球半导体产业链供应链稳定,剥夺其他国家发展先进计算芯片和人工智能等高科技产业的权利 [4] - 商务部强调任何组织和个人执行或协助执行美方措施,将涉嫌违反《中华人民共和国反外国制裁法》等法律法规,须承担相应法律责任 [4] - 外交部表示美方滥用出口管制和"长臂管辖",无端对中国芯片产品和人工智能产业进行恶意封锁和打压,中方对此坚决反对,绝不接受 [8] 华为昇腾芯片的技术优势 - 在一些测试中,华为昇腾芯片的效率比英伟达A100高出20% [11] - 华为云推出CloudMatrix 384超节点,基于昇腾云商用,规模、性能和可靠性全面超过英伟达NVL72 [11] 中美经贸关系的长期博弈 - 美国对华战略遏制逻辑未根本扭转,维护技术霸权、遏制中国发展的战略意图一以贯之 [9] - 中国立足14亿人的超大市场,推进"内循环",同时坚定开放,与欧盟、东盟等签下大量订单,签署中俄、中巴等联合声明 [10][11] - 分析认为美国此次全球封禁华为芯片是其"焦虑症"的再次发作,中国已为持久战做好准备 [11]
华为云黄瑾:六大科技创新,昇腾云定义下一代AI基础设施
经济网· 2025-05-19 16:17
华为云AI基础设施创新 - 华为云推出CloudMatrix 384超节点架构 具备六大技术优势:MoE亲和 以网强算 以存强算 长稳可靠 朝推夜训 即开即用 [1][3] - 超节点采用全对等互联架构 通过新型高速互联总线实现384张卡互联 最高提供300Pflops算力规模 比业界同类产品领先67% [3] - 当前大模型训练需求增长1万倍 但过去8年单卡算力仅增40倍 节点内总线带宽增9倍 跨节点网络带宽仅增4倍 集群网络通信成为最大挑战 [3] 技术架构突破 - 超节点集群已在芜湖 贵安 内蒙古规模上线 采用MoE亲和架构实现从小作坊到超级工厂的转变 [4] - 创新双层网络设计破解数据堵车问题 弹性内存改写算存绑定模式 具备故障自愈能力 [4] - 实现算力资源错峰用电和即开即用的普惠模式 提升资源利用率 [4] 行业应用与战略 - 华为云战略定位为昇腾云服务支持百模千态 盘古大模型重塑千行万业 [5] - 昇腾AI云服务已全面适配160多个大模型 包括DeepSeek等 以云服务方式协助客户进行模型开发训练托管和应用 [5] - 服务覆盖政府 金融 零售 互联网 交通 制造等行业600多家创新先锋企业 加速行业智能化应用落地 [5] - 公司致力于打造AI算力底座 提供安全稳定高质量的AI云服务 赋能行业数字化转型 [5]
华为云黄瑾:传统计算架构难支撑AI代际跃迁,超节点架构是创新
贝壳财经· 2025-05-16 20:56
华为云AI技术突破 - 公司推出CloudMatrix 384超节点架构,解决传统计算架构难以支撑AI技术代际跃迁的问题 [1] - 该架构通过新型高速互联总线实现384张卡互联,提供300Pflops算力规模,比英伟达NVL72提升67% [1] - 超节点架构具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [1] 算力需求与瓶颈 - AI算力需求在过去8年增长1万倍,但单卡硬件算力仅增长40倍,节点内总线带宽增长9倍,跨节点网络带宽仅增长4倍 [1] - 集群网络通信成为当前大模型训练和推理的最大挑战 [1] 技术优势与创新 - 超节点架构通过高速互联总线实现一卡一专家高效分布式推理,单卡MoE计算和通信效率大幅提升 [2] - MatrixLink服务具有两层网络,超节点内384张卡互联时延低至微秒 [2] - EMS弹性内存存储通过内存池化技术实现显存和算力解绑,首Token时延最高降低80% [2] - 昇腾云脑运维"1-3-10"标准将硬件故障感知率从40%提升至90% [2]
华为云黄瑾:传统计算架构已难以支撑AI技术代际跃迁,超节点架构开辟AI产业新路径
新浪科技· 2025-05-16 19:25
华为云AI峰会核心观点 - 华为云推出CloudMatrix 384超节点技术,通过全对等互联架构解决大模型训练和推理中的通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战 [1][2] - 该技术实现384张卡互联成为超级云服务器,提供300Pflops算力规模,比业界同类产品领先67% [2] - 超节点架构是系统性、工程性创新,重新定义新一代AI基础设施 [2] 技术演进与挑战 - 大模型训练从单卡、单机演进到AI集群训练,算力需求增长1万倍 [1] - 过去8年单卡算力增长40倍,但节点内总线带宽仅增长9倍,跨节点网络带宽仅增长4倍,集群网络通信成为最大挑战 [1] - 当前AI算力瓶颈已从单卡算力转移到集群间通信带宽 [1] CloudMatrix技术优势 - 具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [2] - 已在芜湖、贵安、内蒙规模上线 [2] - 采用新型高速互联总线技术 [2] 华为云AI战略 - 坚持"昇腾云服务支持百模千态,盘古大模型重塑千行万业"战略 [3] - 已全面适配DeepSeek等160多个大模型 [3] - 服务政府、金融、零售等600多家创新先锋企业 [3] - 通过昇腾AI云服务提供训练、推理性能升级,推动行业智能化应用落地 [3]
【产业互联网周报】英伟达H20进口不受反制关税影响;微软旗下合资外包公司停止中国区运营;李飞飞团队AI报告:中美顶级模型性能差距缩至0.3%;TikTo...
钛媒体APP· 2025-04-14 16:46
公司动态与人事变动 - 微软中国发布正式声明,澄清关于微软将停止在中国运营的报道为不实信息,指出相关邮件内容实际涉及外包公司上海微创软件公司[2] - 蚂蚁集团副总裁、前百灵大模型负责人徐鹏已离职,其曾负责的AI创新研发与应用部门NextEvo在2024年底的架构调整后由西亭负责[3] - 字节跳动数据平台团队原负责人罗旋因个人原因休假,关于“数据BP可能会拆分至业务中”的网络传言为不实消息[4] - 阿里巴巴创始人马云在阿里云新财年启动会上发表演讲,强调AI的未来应是解放人类、理解人类并服务人类,而非取代人类[6] - 百川智能创始人王小川发布内部信,反思公司此前战线拉得太长、不够聚焦,并明确未来将集中资源破题AI医疗领域[6] - OpenAI宣布GPT-4将于4月30日起被GPT-4o完全替代,但GPT-4将继续通过API提供服务,同时公司计划下周揭晓包括GPT-4.1在内的新AI模型[9] - OpenAI对埃隆·马斯克提起反诉,指控其存在骚扰行为,并要求法官阻止马斯克对OpenAI采取进一步的非法行动[11] - 亚马逊CEO安迪·贾西在年度股东信中披露,公司AI业务营收保持三位数年增长率,已形成数十亿美元规模,并有超1000个生成式AI应用正在开发中[10] 产品与技术发布 - 华为云发布CloudMatrix 384超节点,通过革命性高速互联总线技术实现384节点全对等互联,算力密度提升50倍达300PFlops,互联带宽提升10倍以上,关键特性据称已超越英伟达NVL72超节点[5] - 硅基流动宣布,搭载CloudMatrix架构的昇腾云支撑其实现单卡1920 tokens/s的DeepSeek-R1推理性能,表现比肩英伟达H100[5] - 谷歌发布专为AI设计的第七代TPU加速器“Ironwood”,单芯片峰值算力达4,614 TFLOPs,HBM容量提高至192GB(为Trillium的6倍),内存带宽达7.2Tbps(为Trillium的4.5倍)[15] - Meta发布Llama 4系列模型,但其中Llama 4 Maverick模型因在LM Arena评测榜中位居第二而陷入“刷榜”争议,被指利用定制回复破坏公平性[14] 融资与并购 - 具身智能创业公司穹彻智能完成数亿元人民币Pre-A++轮融资,投资方包括云启资本、盛宇投资等多家机构,资金将用于基础模型研发和商业化应用探索[18][19] - 人形机器人公司星尘智能连续完成A轮及A+轮融资,融资额达数亿元人民币,由锦秋基金、蚂蚁集团领投[20] - 人工智能感知与边缘计算芯片企业爱芯元智完成超十亿元人民币C轮战略融资,为2024年国内芯片领域规模最大的融资事件之一[21] - 知名风险投资机构a16z正寻求筹集约200亿美元基金,这将是其历史上规模最大的基金,重点投向人工智能领域的成长期公司[9] 政策与市场环境 - 中国国务院关税税则委员会宣布,自2025年4月10日起,对原产于美国的所有进口商品加征34%关税,2024年中国从美国进口商品总值为1636.23亿美元[7] - 美国总统特朗普宣布将签署行政令,再次给予TikTok“不卖就禁用”法律75天宽限期,此宽限期原定于4月5日到期[12][13] - 中国半导体协会发文强调,根据海关总署规定,“集成电路”流片地认定为原产地,这意味着英伟达AI芯片H20等由美国设计、境外代工的芯片不受中国反制关税影响[4] - 白宫发布政策文件,要求美联邦机构任命首席AI官,负责推动AI创新并制定“AI战略”[18] - 欧盟委员会宣布推出“人工智能大陆行动计划”,计划构建大规模AI计算基础设施,设立目标规模200亿欧元的InvestAI基金,并计划在未来五到七年内将欧盟数据中心容量至少提升两倍[16] 行业趋势与研究报告 - 斯坦福大学人工智能研究所发布的《2025年人工智能指数报告》指出,中美顶级AI大模型性能差距已由2023年的17.5%大幅缩减至0.3%[8] - IDC发布预测,到2028年全球人工智能IT总投资规模将增至8159亿美元,五年复合增长率为32.9%,其中生成式AI市场五年复合增长率预计达63.8%,2028年市场规模将达2842亿美元[25] - IDC预计到2028年中国人工智能总投资规模将突破1000亿美元,五年复合增长率为35.2%,中国将继续引领亚太地区人工智能市场发展,占该地区总支出超五成[25][26] - GSMA报告预测,到2030年移动技术与数字化转型将为中国经济贡献2万亿美元,约占中国GDP总量的8.3%,其中制造业贡献占比高达40%[27] - 深圳市市长覃伟中表示,深圳将加快培育壮大人工智能、机器人等战略性新兴产业集群,并前瞻布局具身智能未来产业[22] - 北京市经济和信息化局印发行动方案,提出支持通用智能体发展,对符合条件的通用智能体给予最高不超过3000万元的算力成本支持,并推动相关标准制定[23] - 北京市医疗保障局等九部门印发措施,提出建设医疗健康行业大模型测评体系,支持不少于10个AI+医疗场景的模型开发应用[24] - 谷歌母公司Alphabet重申2025年将斥资约750亿美元建设数据中心容量,以加倍押注生成式人工智能[17]