NVIDIA BlueField DPUs
搜索文档
HPE Transforms Distributed AI Factories Into Intelligent AI grid Powered by NVIDIA
Businesswire· 2026-03-18 02:00
公司发布新产品 - 慧与公司宣布推出HPE AI Grid,这是一个端到端的解决方案,基于英伟达参考架构构建,旨在安全地连接跨区域和远边缘站点的AI工厂和分布式推理集群 [1] - 该解决方案旨在将AI安装转变为一个单一的智能系统,使服务提供商能够部署和运营数千个分布式推理站点 [1] - HPE AI Grid是“NVIDIA AI Computing by HPE”产品组合的一部分,旨在为实时AI服务提供可预测的超低延迟性能、零接触配置以及集成编排的自动化安全 [2] 产品核心价值与特点 - HPE AI Grid重新定义了AI交付方式,将智能移至数据和用户所在之处,使网络成为实时体验的可靠基础架构 [3] - 该产品使服务提供商能够以安全、可扩展的方式将分布式推理作为单一系统运营,提供可预测的超低延迟性能,帮助客户更快创新、降低风险并创建新服务 [3] - AI Grid统一了地理上分散的AI集群,将AI工作负载放置在最佳运行位置,在AI工厂、区域站点和边缘之间平衡性能、成本和延迟 [3] - HPE AI Grid与英伟达AI Grid参考架构保持一致,提供统一的硬件和软件堆栈,其差异化在于HPE能够提供全栈AI服务器和AI网络 [3] 产品构成组件 - 产品包含搭载英伟达加速计算(包括NVIDIA RTX PRO 6000 Blackwell GPU)的HPE ProLiant边缘及机架服务器,以及英伟达BlueField DPU、Spectrum-X以太网交换机、Connect-X SuperNIC和用于快速AI推理的AI蓝图 [5] - 产品包含HPE Juniper的电信级多云路由和相干光技术,用于可预测的长途和城域连接;云原生和多租户安全;防火墙;广域网自动化;以及用于实现零接触部署和生命周期运营的编排 [5] 目标应用场景 - 关键应用场景包括依赖低延迟、实时连接的AI服务和使用案例,例如零售个性化、制造业预测性维护、医疗保健本地化边缘推理以及电信级AI服务 [1] - 服务提供商的用例从零售个性化、预测性维护到边缘医疗保健和电信级AI服务,都要求可预测的超低延迟连接 [4] - HPE AI Grid让运营商能够将具备电力和连接的现有站点转变为支持无线接入网的AI网格,从而实现大规模的分布式推理和新服务 [4] 市场验证与合作伙伴 - 作为推进其AI网格战略的一部分,康卡斯特宣布在其高度分布式的网络上进行新的AI现场试验,旨在为下一波AI应用解锁更快、响应更迅速的实时边缘AI推理体验 [6] - 初步试验涉及多个用例,包括利用运行在英伟达GPU上的Personal AI小语言模型的HPE ProLiant服务器,为小型企业提供AI驱动的“前台”服务 [6] - 加拿大电信公司TELUS表示,HPE和英伟达是其构建加拿大最快、最强大的超级计算机“TELUS主权AI工厂”的战略合作伙伴,并有意进一步探索由英伟达驱动的HPE AI Grid解决方案 [7] - 英国网络运营商CityFibre表示正在探索基于英伟达参考架构的HPE AI Grid如何支持分布式AI推理并将智能更贴近用户和数据,看到了将高性能连接与智能服务相结合为客户服务的潜力 [7] 财务支持方案 - HPE金融服务部门为加速AI就绪网络和分布式AI基础设施的采用,将其网络AIOps软件(包括HPE Juniper Networking Mist)的0%融资优惠进行扩展 [7] - 该部门提供的融资方案,在AI就绪网络租赁上相当于提供10%的现金节省 [7]
Arrcus Inference Network Fabric (AINF) Announces Integration With NVIDIA Dynamo Framework, NVIDIA Bluefield DPUs and NVIDIA Spectrum Networking to Significantly Improve the Delivery of Next Generation of Physical and Agentic AI Applications
Businesswire· 2026-03-16 22:30
公司动态与产品发布 - 公司Arrcus宣布其Arrcus Inference Network Fabric与NVIDIA AI基础设施集成 包括NVIDIA Dynamo框架 NVIDIA BlueField-3 DPU和NVIDIA Spectrum-X以太网网络及GPU平台 [1] - 该集成解决方案旨在智能且安全地引导流量 以实现更快的应用响应 更低延迟 更高的能效以及更低的单次推理成本 [1] - 公司CEO表示 此次集成使运营商和企业能够智能路由推理流量 最大化GPU利用率 并在全球范围内提供实时AI服务 [2][3] 技术方案与产品功能 - AINF作为智能体AI的中央指挥 利用在NVIDIA AI基础设施上运行的智能LLM分类器 实时确定最合适的模型并将请求路由至最优站点和网络路径 [6] - AINF与NVIDIA Dynamo配合 作为分布式推理的全局路由层 根据模型可用性 服务层级 地理围栏策略 站点容量和实时网络健康状况 将请求智能引导至最优站点 [6] - AINF与NVIDIA BlueField-3 DPU集成 为跨地域推理流量提供安全保护 支持高达400 Gb/s的线速加密且零CPU开销 [8] - 结合NVIDIA Spectrum-4以太网交换机和GPU平台 该解决方案提供了一个为性能 效率和安全性而设计的端到端推理网络结构 [8] - AINF负责确定应由哪个站点服务推理请求 而NVIDIA Dynamo则决定该站点内的哪个副本进行响应 从而确保大规模部署中计算资源的最优利用 [7] 行业趋势与市场需求 - AI正从集中式训练转向全球分布式推理 基础设施需求正在迅速变化 [3] - 智能体AI工作流通常需要跨多个模型和工具链接数十次推理调用以完成任务 这些工作流需要在请求进入网络的瞬间进行智能模型解析 优先级分类和策略执行 [3] - 从机器人 自主系统到视频分析和智能体工作流等实时AI应用 需要安全的多站点连接 高效的GPU利用率和智能模型选择 [3] - 传统的网络和负载均衡方法缺乏政策感知和动态路由能力 无法在全球规模上支持此类需求 [5] 客户案例与合作 - 运营商Lightstorm表示 亚太地区的大规模AI推理需要跨越广域网的可靠低延迟连接 通过利用Arrcus基于NVIDIA的AINF解决方案 有望在该地区实现实时大规模推理部署 [4] - Lightstorm作为亚太地区领先的数字基础设施和连接提供商 正与Arrcus合作 为分布式AI推理和训练工作负载提供专用网络解决方案 [17] - Arrcus还与富士通及1Finity围绕富士通新一代高能效Arm架构CPU FUJITSU-MONAKA合作 旨在为新兴的物理AI 智能体AI和训练AI时代提供安全 高能效的基础设施 [18][19] 公司背景 - Arrcus是网络软件解决方案的领先提供商 总部位于加利福尼亚州圣何塞 公司CEO为Shekar Ayyar 拥有140名员工 [12][14][20]
VAST Data Federal and Leidos Introduce Agentic Cybersecurity with NVIDIA AI
Globenewswire· 2025-10-29 02:30
文章核心观点 - VAST Data Federal与Leidos宣布建立战略合作伙伴关系,旨在为全球企业和联邦机构提供一个由NVIDIA AI技术驱动的新型可扩展网络防御模型 [1] - 该解决方案整合了Leidos的网络专业知识、NVIDIA的加速计算与AI软件以及VAST AI操作系统,目标是将安全团队从警报过载状态转变为由AI编排的自动化响应 [1][2][3] 合作伙伴与解决方案构成 - 合作方包括VAST Data Federal(VAST Data子公司)、Leidos(NYSE: LDOS)以及技术提供方NVIDIA [1] - 解决方案核心技术栈包括:NVIDIA AI Enterprise软件、NVIDIA Morpheus、NVIDIA BlueField DPUs用于实时检测推理,以及VAST DataEngine和VAST DataBase用于即时搜索多年遥测数据 [2][3] 解决的核心问题与方案优势 - 当前全球企业和联邦机构的安全管道每秒产生数万亿事件,日志、遥测和警报数量远超人工处理能力,导致盲点、人员倦怠和响应迟缓 [2] - 方案优势在于通过AI实现加速检测,减少噪音,并提供基于策略的快速行动,帮助团队从警报疲劳转向自信的自动化安全 [2][3] - 具体能力包括:对多年冷热数据进行即时查询和向量搜索以发现隐藏信号;AI代理在边缘自动过滤噪音、确定警报优先级并构建事件时间线;低延迟、大规模并行搜索加速网络取证 [3][6] 客户价值与效益 - 客户可获得的关键效益包括:消除基于数据摄入的许可和热存储层限制,以更低的成本长期保留更多遥测数据,消除盲点 [6] - 提升运营简易性和分析师效率,减少人工关联和易出错的手动交接,使人力专注于判断和监督 [6] - 一致的、基于策略的自动化有助于满足合规性和任务要求 [6] 市场展示与资源 - 该解决方案的演示将于NVIDIA GTC DC的339号展位进行现场展示,重点展示实时数据包检测、异常加速检测以及由VAST AI操作系统编排的端到端代理响应 [4] - VAST Data Federal是VAST Data专注于美国公共部门的子公司,其VAST AI操作系统基于突破性的DASE架构,旨在从数据中心到战术边缘统一数据与计算服务,部署智能系统并自动化复杂工作流 [5][8]
NVIDIA and Storage Industry Leaders Unveil New Class of Enterprise Infrastructure for the Age of AI
Globenewswire· 2025-03-19 03:24
核心观点 - NVIDIA推出AI数据平台 与领先存储提供商合作构建新型AI基础设施 用于支持企业级AI推理工作负载和查询代理 [1][4][5] 平台技术架构 - 平台采用NVIDIA Blackwell GPU、BlueField DPU和Spectrum-X网络加速数据访问 BlueField DPU性能较CPU方案提升1.6倍 功耗降低50% 每瓦性能提升3倍 Spectrum-X网络加速AI存储流量达48% [3][6] - 集成AI-Q Blueprint开发框架 通过NeMo Retriever微服务实现数据提取检索速度提升15倍 [7][8] - 支持多模态数据处理 包括文本、PDF、图像和视频等结构化与非结构化数据 [8] 合作伙伴与产品整合 - 十大存储供应商参与合作 包括DDN、戴尔、HPE、日立、IBM、NetApp、Nutanix、Pure Storage、VAST Data和WEKA [4][13] - 各厂商具体整合方案:DDN Infinia AI平台、戴尔PowerScale系列、HPE私有云与存储产品线、日立IQ生态系统、IBM Fusion存储、NetApp AIPod解决方案、Nutanix统一存储、Pure Storage FlashBlade、VAST InsightEngine及WEKA软件平台 [13] 平台功能特性 - 提供近实时企业数据洞察能力 通过AI查询代理实现复杂查询的精准响应 [2][8] - 支持混合数据中心部署 实现跨边缘、数据中心和公有云的推理与代理工作流 [12][13] - 采用NVIDIA NIM微服务架构 集成具备推理能力的Llama Nemotron模型 [2]