Workflow
两颗AI芯片,重要进展
半导体行业观察·2025-07-23 08:53

Hailo-10H AI加速器发布 - Hailo推出第二代AI加速器Hailo-10H,支持大型语言模型、视觉语言模型等生成式AI功能,无需依赖云连接 [3] - 芯片基于Hailo-8处理器优化,功耗仅2.5瓦,适用于边缘设备、智能家居、汽车和电信基础设施 [4] - 支持超低延迟实时响应,在2B参数模型上每秒处理超过10个token,4K物体检测性能领先 [5] - 完全兼容现有软件堆栈,拥有超过10,000名开发者的全球社区支持 [4] - 符合AEC-Q100 2级汽车标准,计划2026年量产应用于汽车系统 [5] - 公司已完成九轮融资共5.64亿美元,投资者包括SKC、三菱UFJ Capital等 [5] FuriosaAI RNGD加速器获LG采用 - 韩国AI芯片初创公司FuriosaAI的RNGD推理加速器被LG AI研究部门采用,用于运行Exaone系列大型语言模型 [6][7] - RNGD芯片浮点性能256-512 teraFLOPS,配备48GB HBM3显存,带宽1.5TB/s,功耗仅180瓦 [7][8] - 在Exaone模型测试中,能效比LLM推理GPU高达2.25倍 [8] - 采用张量收缩处理器架构,比GPU执行矩阵乘法所需指令更少,数据移动更少 [9] - 算力达每瓦1.4 TeraFLOPS,接近Nvidia Hopper一代水平 [10] - LG使用四块RNGD卡以FP16精度运行Exaone 32B模型,首个token响应时间0.3-4.5秒 [11][13] 行业竞争格局 - FuriosaAI曾拒绝Meta 8亿美元收购要约,坚持自主研发路线 [16] - 与Nvidia H100相比,RNGD在功耗效率上具有优势,但性能和带宽较低 [10] - 公司计划扩大架构规模以与最新GPU竞争,包括增加HBM堆栈和计算芯片 [17] - AI芯片行业正面临能效和性能的平衡挑战,边缘计算和云端推理需求并存 [4][7]