Tokens服务

搜索文档
华为云CEO:384超节点每卡性能可达英伟达H20三倍
观察者网· 2025-08-30 11:38
公司战略与定位 - 华为云强调以提供客户所需计算结果为核心目标 而非单纯依赖芯片工艺[1] - 公司通过系统级创新弥补单点短板 包括以空间换算力 以带宽换算力 以能源换算力[1] - 组织架构调整为聚焦3+2+1业务:通算 智算 存储三大基础服务 AI PaaS与数据库两大平台 安全业务一个核心[6] - 调整目的为集中资源最大化"昇腾AI+盘古"组合优势 砍掉协同效应弱的外围研发[6] 技术突破与产品进展 - 发布CloudMatrix384超节点 集成384颗昇腾NPU和192颗鲲鹏CPU 算力达300 PFlops[2] - 通过xDeepServe架构实现单芯片2400TPS吞吐量与50msTPOT时延 超越业界水平[2][3] - xDeepServe采用Transformerless分离架构 将MoE大模型拆分为Attention/FFN/Exper微模块并行处理[3] - 超节点单卡吞吐量从600tokens/s提升至2400tokens/s 达H20芯片效率的三倍[3] - 支持横向扩展至16万卡AI集群 可同时训练1300个千亿参数大模型[2] 市场表现与客户增长 - 昇腾AI云服务客户数从321家增长至1714家 同比增长434%[5] - 整体算力规模同比增长接近250%[5] - 在中国大陆云服务市场占据18%份额 位列第二[6] - 智能驾驶领域取得突破 引望(中国最大智驾企业)已部署于昇腾平台[6] - CloudMatrix384在感知模型/E2E/VLA模型测试中达到H100的2.5-3倍性能[6] 基础设施布局 - 围绕贵安 乌兰察布 和林格尔 芜湖打造全国算力一张网[5] - 仅在贵州已部署超40套CloudMatrix384超节点[5] - 华为云贵安汽车专区正式上线 长安天枢智驾搭载CloudMatrix384亮相[5] - 云服务连续756天保持重大事故为零记录[5] 行业趋势与认知 - 未来十年算力需求可能有数万倍增长[1] - 市场主流需求从"上云"转向"上AI" AI工作负载成为云业务核心引擎[6] - 需以AI原生思维重构应用 数据 流程和人员组织[7] - 中国拥有千行万业业务场景 有望在各行业构筑全球AI领先优势[7]
华为云张平安:坚持打造“算力黑土地” 加速行业智能跃迁
央广网· 2025-08-28 21:52
央广网贵阳8月28日消息(记者殷雨婷)8月28日,中国国际大数据产业博览会在贵州省贵阳市举办,华为常务董事、华为云计算CEO张平安在大会开幕 式上表示,面对未来十年算力需求的数万倍增长,华为云将坚定不移地打造"算力黑土地",充分发挥公司多年积累的联接技术优势和数据中心资源布局,以 优的性能、好的服务、低的成本,通过昇腾AI云服务和Tokens服务满足客户的"最终计算结果",加速行业智能跃迁。 图为华为常务董事、华为云计算CEO张平安 发挥"大杂烩"优势,打造算力"黑土地" 算力是智能世界的基础设施,大模型催生了对大算力的需求,未来十年,算力的需求可能会有数万倍的增长。 张平安介绍道, 华为云一直坚定打造"算力黑土地",围绕贵安、乌兰察布、和林格尔、芜湖三大核心枢纽,打造 "全国算力一张网",中国的算力黑土 地正在成为支持全球客户的AI算力场。今天,华为云的整体算力规模相比去年同期增长率接近250%,使用昇腾AI云服务的客户从去年的321家增长到今年的 1714家。 在贵安,华为云部署了最大规模的CloudMatrix384超节点,服务全国客户,打造东数西算工程的标杆;在贵安、乌兰察布还建设了超大规模的灾备云中 ...
华为云张平安:坚持打造“算力黑土地”,加速行业智能跃迁
经济网· 2025-08-28 16:41
张平安介绍道, 华为云一直坚定打造"算力黑土地",围绕贵安、乌兰察布、和林格尔、芜湖三大核心枢纽,打造 "全 国算力一张网",中国的算力黑土地正在成为支持全球客户的AI算力场。今天,华为云的整体算力规模相比去年同期增长率 接近250%,使用昇腾AI云服务的客户从去年的的321家增长到今年的1714家。 在贵安,华为云部署了最大规模的CloudMatrix384超节点,服务全国客户,打造东数西算工程的标杆;在贵安、乌兰 察布还建设了超大规模的灾备云中心,为企业,尤其是央国企,提供高性能、稳定可靠的算力服务。 在目前芯片工艺受限情况下,如何提升算力的性能和规模?张平安表示,华为可以发挥"大杂烩"的优势——综合在光 通信、网络、供电等多方面的技术,以系统补单点,以空间换算力,以带宽换算力,以能源换算力,通过云上算力集群, 获得规模优势和提升性能。 今年4月,华为云在芜湖发布了CloudMatrix384超节点,将384颗昇腾NPU和192颗鲲鹏CPU,通过全新高速网络 MatrixLink全对等互联,形成一台超级"AI服务器",算力规模可以达到300 PFlops。此外,对于万亿、十万亿参数的大模型 训练任务,还可 ...