Workflow
Compute - In - Memory
icon
搜索文档
Compute-In-Memory APU Achieves GPU-Class AI Performance at a Fraction of the Energy Cost
Globenewswire· 2025-10-20 21:00
公司技术突破 - 公司发明的关联处理单元是一种人工智能和高性能计算处理领域的范式转变技术,提供真正的内存计算技术 [1] - 康奈尔大学研究证实,公司的APU CIM架构在大型AI应用中可达到GPU级别的性能,同时因CIM架构的高密度和高带宽内存特性,能耗显著降低 [1] - 康奈尔大学研究团队对公司的Gemini-I APU与主流CPU和GPU进行了基准测试,重点关注在10GB至200GB数据集上的检索增强生成任务 [2] 性能与效率优势 - Gemini-I APU在RAG工作负载上提供了与NVIDIA A6000 GPU相当的吞吐量 [6] - APU的能耗比GPU低98%以上,突显其效率和可持续性优势 [6] - APU的独特设计使其执行检索任务的速度比标准CPU快数倍,总处理时间缩短高达80% [6] - 公司最新发布的第二代APU芯片Gemini-II,可为内存密集型AI工作负载提供约10倍吞吐量和更低延迟,同时进一步提高能效 [4] 市场机遇与应用领域 - 内存计算技术有潜力颠覆价值1000亿美元的AI推理市场 [2] - 技术优势为公司在边缘AI、数据中心、国防等能源效率是关键战略优势的高增长市场带来机遇 [4] - 具体应用场景包括功耗受限的机器人、无人机、物联网设备的边缘AI,以及能源和冷却条件受限的国防和航空航天领域 [3] 行业认可与未来发展 - 相关研究论文发表在ACM上,并在Micro '25会议上展示,这是对商用内存计算设备在现实工作负载下的首批全面评估之一 [2] - 康奈尔大学的研究还为通用内存计算设备引入了一个新的分析框架,提供了优化原则,强化了APU作为可扩展开发平台的定位 [4] - 公司未来的Plato产品将为嵌入式边缘应用提供更强计算能力和更低功耗 [4]