文章核心观点 - 谷歌发布名为Coral NPU的全栈开源AI平台,旨在解决边缘AI设备在性能、碎片化和隐私方面的核心挑战,为下一代低功耗、始终在线的边缘AI应用构建基础 [4][5][26] 产品定位与目标 - Coral NPU定位为全栈开源平台,专注于解决低功耗边缘设备和可穿戴设备上应用强大AI技术时面临的性能差距、碎片化成本和用户信任缺失三大挑战 [4] - 该平台目标是在智能手表等设备上实现本地持续运行的AI,让智能直接嵌入用户个人环境,同时最大限度减少电池消耗 [4][5][22] 技术架构与性能 - Coral NPU采用NPU架构,基于符合RISC-V指令集架构的IP模块,专为最低功耗设计,是始终在线环境感知的理想选择 [8] - 基础设计在仅消耗几毫瓦功率的情况下,可提供512 GOPS级别的性能,为边缘设备、耳戴式设备、AR眼镜和智能手表带来强大端侧AI能力 [8] - 架构包含三个组件:一个用于管理数据流的轻量级RISC-V标量核心、一个强大的单指令多数据向量执行单元,以及一个专为加速神经网络运算的矩阵执行单元(仍在开发中) [10][11] 开发者体验与工具链 - Coral NPU提供统一开发者体验,是一个可用C语言编程的目标平台,可与IREE和TFLM等现代编译器无缝集成,支持TensorFlow、JAX和PyTorch等机器学习框架 [15] - 平台包含全面软件工具链,如TFLM编译器、通用的MLIR编译器、C编译器、自定义内核和模拟器,为开发者提供灵活路径以简化机器学习模型编程 [15][17] - 行业标准工具有助于在各种硬件目标上提供一致体验,工具链展示了从模型创建、优化、编译到设备端部署的完整流程 [17][20] 目标应用与合作伙伴 - Coral NPU旨在支持超低功耗、始终在线的边缘AI应用,尤其侧重环境感知系统,潜在用例包括情境感知、音频处理、图像处理和用户交互 [22][25] - 平台通过与Gemma团队合作优化以支持小型Transformer模型,确保加速器架构能够支持下一代边缘生成式AI [24] - 谷歌宣布与Synaptics建立战略芯片合作伙伴关系,其新的Astra SL2610系列AI原生物联网处理器采用了业界首个Coral NPU架构的量产实现 [22][23]
谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行