AI推理性能优化

搜索文档
倒计时 6 天!致全球 GPU Kernel 极客:AMD 的 10 万美金“战书”请查收!
AI科技大本营· 2025-04-24 17:09
赛事概述 - AMD发起并全程赞助2025推理优化挑战赛 面向全球GPU kernel开发者 旨在挑战AI推理性能极限 [3] - 赛事总奖金100 000美金 优胜者可受邀赴美参加AMD Advancing AI Day颁奖盛典 [3][4] - 最优方案将深度整合至AMD ROCm开源生态 提升全球影响力 [4] 参赛规则 - 参赛形式支持单人或团队(≤3人) 无国籍限制 需通过AMD官方验证并绑定GitHub ID [6] - 优化目标为三重DeepSeek算子:FP8 GEMM MLA with Rope Fused MoE [6] - 提交方案可使用Triton Composable Kernel或HIP编写 每两周开放PyTorch参考实现及理论性能数据 [6] 技术价值 - 赛事直击AMD GPU底层算力瓶颈 优化成果将定义下一代推理性能标准 [8] - 参赛者无需本地GPU 通过云端算力平台专注底层算子优化(low-level kernel) [6] 时间节点 - 报名截止2025年4月30日 代码提交截止2025年6月8日 [7] - 硅谷颁奖典礼定于2025年6月12日举行 [7] 参赛入口 - 通过CSDN赛事官网(https://t.csdnimg.cn/amd)或官方群组报名 [11]