用RISC-V打造GPU?太行了
如果您希望可以时常见面,欢迎标星收藏哦~ 在这些加速器中,图形处理单元 (GPU) 已被证明在利用数据并行性进行机器学习和信号处理任务 方面尤为有效。当与主机 CPU 结合使用时,GPU 可形成加速处理单元 (APU),从而实现一个统 一的平台,能够高效处理通用任务和计算密集型工作负载。 虽 然 存 在 各 种 GPU 实 现 方 案 , 从 高 性 能 到 嵌 入 式 解 决 方 案 , 但 它 们 在 超 低 功 耗 边 缘 设 备 (TinyAI)环境下的权衡利弊仍未得到深入研究。这些电池供电的设备在严格的功耗限制下运 行,通常在几十毫瓦的范围内,因此需要高效的 GPU 架构。 它们小巧的外形也对面积造成了严格的限制,完整的片上系统 (SoC) 仅占用几平方毫米的面积。 此 外 , 由 于 缺 乏 文 件 系 统 和 多 线 程 支 持 , 传 统 的 GPU 编 程 框 架 ( 例 如 标 准 开 放 计 算 语 言 (OpenCL) 实现)无法使用,因此需要进行自定义优化。 图形处理单元 (GPU) 擅长并行处理,但由于其功耗和面积限制,以及缺乏合适的编程框架, 在超低功耗边缘设备 (TinyAI) ...