AI模型安全
搜索文档
英伟达Triton推理服务器被曝高危漏洞 AI模型安全面临严重威胁
犀牛财经· 2025-08-12 10:52
据悉,这组漏洞链由三个漏洞组成,分别为CVE-2025-23320、CVE-2025-23319和CVE-2025-23334。当攻击者发送一个超大请求超出共享内存限制时,CVE- 2025-23320会触发异常,返回的错误信息将暴露后端内部IPC(进程间通信)共享内存区的唯一标识符(key)。攻击者利用上述标识符,可通过CVE-2025- 23319执行越界写入,以及通过CVE-2025-23334实现越界读。 英伟达Triton是一个通用的推理平台,旨在帮助开发者简化AI模型在各种框架上的部署和运行。然而,其通用的设计和复杂的进程间通信机制,却成了安全 隐患。 英伟达目前已经发布补丁。但是,所有25.07版本之前的系统都处于"裸奔状态",用户需将Triton Inference Server更新到最新版本。 近日,安全研究机构Wiz Research曝光了英伟达Triton推理服务器的一组高危漏洞链,这一发现引发了业界的广泛关注。 该漏洞链可被组合利用,实现远程代码执行(RCE),攻击者能够读取或篡改共享内存中的数据,操纵模型输出,甚至控制整个推理后端的行为。这意味着 云端AI模型面临着模型被盗、数据泄露 ...
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
量子位· 2025-07-20 10:49
漏洞发现与影响 - 英伟达GPU存在名为GPUHammer的严重漏洞,可通过物理攻击导致模型准确率从80%暴跌至0.02% [1][2][3] - 攻击已在RTX A6000上验证,其他型号可能受影响 [4] - 攻击属于Rowhammer类,通过反复"敲击"显存引发比特翻转篡改数据,首次实现在GPU上的攻击 [6][7][8] 攻击机制与实验数据 - 攻击通过翻转FP16浮点数关键位使指数飙升16倍,导致模型崩溃 [9][10] - 实验显示AlexNet/VGG16/ResNet50等模型平均准确率从71.26%降至0.08%,Top-5准确率从89.59%降至0.58% [12] - 单个比特翻转即可造成性能彻底崩溃,如ResNet50准确率从80.26%跌至0.02% [12] 潜在应用场景风险 - 自动驾驶可能误识别交通标志,医疗AI或出现误诊 [13] - 云平台共享GPU环境中,恶意租户可攻击相邻工作负载破坏模型参数 [13] - 对AI基础设施构成毁灭性威胁 [14] 防御措施与性能权衡 - 英伟达建议启用系统级纠错码(ECC),但仅能修复单比特错误 [16][17][18] - ECC导致A6000GPU内存带宽损失12%,机器学习应用速度降低3%-10% [19] - 默认禁用ECC因其带来6.5%内存开销和减速 [19] 受影响范围与未来防护 - RTX3080/A100等采用不同DRAM架构的芯片可避开攻击 [22] - 未来集成片上ECC的GPU可纠正单位翻转并检测双位翻转 [22] - NVIDIA的MIG和机密计算技术通过内存隔离防止多租户攻击 [22]