Nvidia-英伟达Triton推理服务器被曝高危漏洞 AI模型安全面临严重威胁

安全漏洞事件概述 - 安全研究机构Wiz Research曝光了英伟达Triton推理服务器的一组高危漏洞链[2] - 该漏洞链可被组合利用，实现远程代码执行，攻击者能够读取或篡改共享内存数据、操纵模型输出、控制整个推理后端[2] - 这意味着云端AI模型面临模型被盗、数据泄露、响应操纵以及系统失控等严重风险[2] 漏洞技术细节 - 漏洞链由三个漏洞组成，分别为CVE-2025-23320、CVE-2025-23319和CVE-2025-23334[2] - 攻击者发送超大请求超出共享内存限制时，CVE-2025-23320会触发异常，其返回的错误信息会暴露后端内部IPC共享内存区的唯一标识符[2] - 攻击者利用该标识符，可通过CVE-2025-23319执行越界写入，以及通过CVE-2025-23334实现越界读[2] 产品背景与风险根源 - 英伟达Triton是一个通用的推理平台，旨在帮助开发者简化AI模型在各种框架上的部署和运行[2] - 其通用的设计和复杂的进程间通信机制，成为了安全隐患[2] 公司应对措施 - 英伟达目前已经发布补丁[3] - 所有25.07版本之前的系统都处于“裸奔状态”，用户需将Triton Inference Server更新到最新版本[3]