Workflow
Exaone
icon
搜索文档
两颗AI芯片,重要进展
半导体行业观察· 2025-07-23 08:53
Hailo-10H AI加速器发布 - Hailo推出第二代AI加速器Hailo-10H,支持大型语言模型、视觉语言模型等生成式AI功能,无需依赖云连接 [3] - 芯片基于Hailo-8处理器优化,功耗仅2.5瓦,适用于边缘设备、智能家居、汽车和电信基础设施 [4] - 支持超低延迟实时响应,在2B参数模型上每秒处理超过10个token,4K物体检测性能领先 [5] - 完全兼容现有软件堆栈,拥有超过10,000名开发者的全球社区支持 [4] - 符合AEC-Q100 2级汽车标准,计划2026年量产应用于汽车系统 [5] - 公司已完成九轮融资共5.64亿美元,投资者包括SKC、三菱UFJ Capital等 [5] FuriosaAI RNGD加速器获LG采用 - 韩国AI芯片初创公司FuriosaAI的RNGD推理加速器被LG AI研究部门采用,用于运行Exaone系列大型语言模型 [6][7] - RNGD芯片浮点性能256-512 teraFLOPS,配备48GB HBM3显存,带宽1.5TB/s,功耗仅180瓦 [7][8] - 在Exaone模型测试中,能效比LLM推理GPU高达2.25倍 [8] - 采用张量收缩处理器架构,比GPU执行矩阵乘法所需指令更少,数据移动更少 [9] - 算力达每瓦1.4 TeraFLOPS,接近Nvidia Hopper一代水平 [10] - LG使用四块RNGD卡以FP16精度运行Exaone 32B模型,首个token响应时间0.3-4.5秒 [11][13] 行业竞争格局 - FuriosaAI曾拒绝Meta 8亿美元收购要约,坚持自主研发路线 [16] - 与Nvidia H100相比,RNGD在功耗效率上具有优势,但性能和带宽较低 [10] - 公司计划扩大架构规模以与最新GPU竞争,包括增加HBM堆栈和计算芯片 [17] - AI芯片行业正面临能效和性能的平衡挑战,边缘计算和云端推理需求并存 [4][7]
“英伟达挑战者”FuriosaAI赢得首位大客户LG
华尔街见闻· 2025-07-22 14:52
公司动态 - 韩国人工智能芯片初创公司FuriosaAI获得首个主要客户LG AI Research 经过七个月严格评估后 LG将采用其RNGD芯片为Exaone大语言模型提供算力支持 [1] - FuriosaAI此前拒绝Meta价值8亿美元的收购要约 选择保持独立发展 此次合作标志着其产品正式进入企业级应用阶段 [1][2] - 公司计划与LG共同部署RNGD服务器 为电子 金融等多行业提供Exaone模型服务 同时支持LG内部AI助手ChatExaone的算力需求 [2] 技术优势 - FuriosaAI专注于AI推理芯片研发 其RNGD芯片每瓦推理性能比图形处理器高出2.25倍 构成挑战行业巨头的核心优势 [1] - 公司利用韩国本土半导体生态系统优势 整合三星 SK海力士等企业积累的人才资源与政府激励政策 [1] 市场战略 - FuriosaAI将英伟达 Groq SambaNova Cerebras等企业列为直接竞争对手 试图在AI基础设施领域实现突破 [1] - 公司正积极拓展美国 中东和东南亚市场 预计2023年下半年达成更多合作协议 并计划在IPO前进行新一轮融资 [2] 行业背景 - FuriosaAI是韩国少数专注AI芯片设计的公司之一 与Rebellions Semifive等本土企业共同参与全球AI芯片竞争 [1] - 公司CEO June Paik拥有三星电子和AMD的从业背景 2017年创立至今已完成从研发到商业化的全周期布局 [1]