AI自动生成内核

搜索文档
AI生成苹果Metal内核,PyTorch推理速度提升87%
量子位· 2025-09-04 16:37
henry 发自 凹非寺 量子位 | 公众号 QbitAI AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能 自动生成Metal内核 ,还较基线内核实现了 87% 的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均 1.87倍 的加速,其中一些工作负载甚至比基准快了 数百倍 。 真就AI Make苹果AI Great Again? 用AI为苹果设备生成内核 先说结论:通过AI自动实现内核优化,可以在无需修改用户代码、无需新框架或移植的情况下,显著提升模型性能。 至于为什么是苹果?别问——问就全球最大硬件供应商(doge) 接下来,让我们看看研究人员是怎么做的: 为了证明这一点,研究人员选取了来自Anthropic、DeepSeek和OpenAI的8个顶尖模型,让它们为苹果设备生成优化的GPU内核,以加速 PyTorch推理速度。 实验设置 首先,在模型选择方面,参与测试的模型包括:claude-sonnet-4、claude-opus-4;gpt-4o、gpt-4.1、gpt ...