Workflow
GPU与AI融合
icon
搜索文档
边缘AI正当时,Imagination押注GPU的“AI进化”
半导体行业观察· 2025-05-09 09:13
边缘AI市场趋势与需求 - 边缘侧AI推理正以前所未有的速度增长,应用涵盖自动驾驶、智能手机、工厂设备和消费级机器人等领域,这些应用逐步脱离云端,在本地完成图像识别、路径规划等任务[3] - 边缘AI需求爆发源于多重因素:隐私敏感数据无法上云、实时性要求(如辅助驾驶瞬时响应)以及边缘设备的资源限制(如功耗和算力)[3] - Hugging Face上AI模型下载量从2023年的70万激增至2025年的700万,反映了边缘侧模型部署的几何级增长,同时AI算法从CNN到Transformer再到复杂多模态模型的快速迭代对硬件灵活性和并行计算能力提出更高要求[3] Imagination E系列GPU IP架构创新 - E系列GPU IP最大的亮点在于对"AI+图形"融合的系统性重构,将AI加速能力原生嵌入GPU体系,让GPU从图形引擎演进为通用AI处理核心[8] - 在相同工艺节点下比前一代D系列实现35%的平均能效提升,其背后关键是全新爆发式处理器技术,得益于指令调度路径压缩、每个计算单元配备近0.5MB寄存空间的复用机制以及矩阵乘法运算单元的集成优化等架构升级[8] - 与传统NPU相比,E系列无需回退至CPU处理未知算子,极大提升了系统稳定性和灵活性,实现了AI计算单元与GPU图形管线的深度集成,共享寄存器、缓存与调度机制[8][13] E系列GPU IP性能规格 - E系列Neural Cores支持2TOPS至200TOPS的AI算力覆盖,支持从轻量级终端到复杂多模态系统的全场景部署[17] - 4核1.6GHz配置下,图形填充能力可达400Gpixels/s,FP32浮点运算能力13TFLOPS,而INT8推理性能达到200TOPS,单位面积下的算力密度比前代提升3.6倍[17] - 支持包括FP32、BF16、FP8、MXFP4等多种AI主流格式,结合优化的计算库与图优化编译器,开发者可通过TVM等框架便捷地完成PyTorch、TensorFlow等主流模型的部署与适配[17] 应用场景与扩展能力 - E系列支持多达16个虚拟机实例的运行隔离,可通过硬件虚拟化实现AI、图形、UI等多任务的异步并行处理,在Cockpit域、娱乐域、驾驶辅助域等多种车载场景中展现出良好适配能力[18] - 支持从单核0.25T FP32轻量部署至多核200T强算力横向扩展,具备覆盖移动设备、工业终端、AI PC乃至边缘数据中心的弹性能力[20] - 在智能座舱中可同时承担仪表渲染与人机交互AI任务,在驾驶域内则实现对驾驶员状态的AI监控及语音交互响应[18] 软件生态与市场规划 - 为E系列配套构建了完整软件栈支持,包括数学计算库、FFT、Kernel优化、TVM适配、Graph Compiler、TensorRT Lite推理链,以及多操作系统、编译器工具与调试套件[21] - 在RISC-V生态中扮演关键角色,已与多家RISC-V平台客户进行集成验证,推动开源硬件与高效算力在边缘智能中的协同演进[22] - 为E系列规划了多个子系列产品,分别面向功能安全需求的汽车域控(EXS)、消费电子(EXT)以及AI PC等高性能领域(EXD),首款E-Series GPU IP将于2025年秋季正式上市[22]