震惊,英伟达GPU竟带定位器

文章核心观点 - 英伟达正在开发一项基于“机密计算”技术的位置验证软件服务,旨在帮助客户监控其AI GPU集群的健康状态和库存,并可能用于阻止其高端AI芯片被走私至受出口限制的国家 [1] 英伟达的位置验证技术 - 该技术是一项可由客户自行安装的软件选项,利用英伟达GPU的“机密计算”能力来实现 [1] - 软件通过测量与英伟达服务器通信的时间延迟来推断芯片的大致位置,精度与其他基于互联网的定位服务相当 [1] - 该功能最初是为了让客户能够追踪芯片的整体计算性能,这是大型数据中心运营商的常见需求 [1] - 该功能将首先在最新的“Blackwell”系列芯片上提供,因其在“证明”流程方面比Hopper和Ampere两代产品具备更强的安全功能 [1] - 公司也在研究让早期产品支持相关功能的可能性 [1] 机密计算技术详解 - 机密计算是一种保护使用中数据的技术,可防止任何人查看或篡改数据及运算过程 [3] - 其通过与处理器绑定的加密密钥,构建可信执行环境,生成经加密签名的“证明”以验证硬件和固件的安全配置 [3] - 该技术补齐了数据生命周期防护的最后一块短板,实现了数据在传输、静态存储和使用状态下的全流程无明文暴露 [4][5] - 在云与边缘计算场景下,机密计算将防护重心转向防范设备所有者获取用户数据,操作系统等软件无法读取或修改用户程序的内存数据 [5] - 机密计算的底层基础是每个处理器独有的安全密钥,通过“安全度量启动”和构建“安全飞地”来运行用户应用 [8] - 通过“远程证明”机制,用户可验证机密防护体系是否完好 [8] 英伟达GPU的机密计算实现 - 英伟达在2023年首次推出机密计算,旨在保护数据与代码在使用中的安全 [8] - H100是全球首款支持机密计算的GPU,可在传统虚拟机或基于Kata的Kubernetes机密容器中运行 [8] - H100在芯片上集成硬件可信根,并通过安全启动、SPDM会话及加密签名的“证明报告”构建可信执行环境 [9] - 自Volta、Turing、Ampere到Hopper架构,公司持续增强固件加密、回滚防护等,实现从硬件、固件到驱动的一体化安全栈 [9] - H100的机密计算模式分为CC-Off、CC-On和CC-DevTools三种,启用后CPU与GPU之间的数据、指令、内核均以加密形式传输 [9] - 实现GPU机密计算需配合CPU厂商的CVM能力,如AMD的SEV-SNP和Intel的TDX,并通过设备证书、英伟达远程证明服务等机制验证设备安全 [10] - 在性能上,机密计算模式下GPU原生算力与HBM带宽不受影响,主要开销来自CPU-GPU加密传输与跳板缓冲区带来的延迟 [10]