OpenAI自研芯片,正式发布

文章核心观点 - OpenAI与博通联合发布了首款专为LLM推理设计的AI加速器Jalapeño,标志着OpenAI向构建全栈技术基础设施迈出重要一步,旨在通过自研硬件提升AI性能、可靠性与经济性,并计划从2026年开始部署千兆瓦级数据中心 [1][3][5][11] 产品设计与技术特点 - Jalapeño是OpenAI基于其对LLM基本原理及未来需求的深刻理解,从零开始设计的专用AI加速器,并非基于早期AI工作负载改造的通用加速器 [4][6] - 该芯片设计兼顾灵活性,能够与所有LLM兼容,其架构减少了数据传输,平衡了计算、内存和网络资源,使实际利用率更接近理论峰值性能 [4] - 早期测试表明,Jalapeño的每瓦性能将显著优于目前最先进的技术,一份详细的性能技术报告将在未来几个月内发布 [4] - 该芯片旨在将当今领先AI加速器的性能、吞吐量与接近最快专用推理系统的低延迟相结合,非常适合大规模交互式LLM产品 [6][7] 开发与生产合作 - 从最初设计到最终流片仅用了九个月,这得益于与OpenAI工程团队的深度软硬件联合开发、博通的芯片实现专长,以及利用OpenAI模型加速部分设计和优化流程 [9] - OpenAI与合作伙伴博通和Celestica携手,通过芯片实现、电路板和机架系统集成、高性能网络以及可扩展的生产系统,实现该平台的产业化 [4] - 博通的芯片实现和网络技术,包括Tomahawk网络芯片,助力该平台实现大规模量产 [4] 战略与行业影响 - Jalapeño是OpenAI长期全栈基础设施战略的一部分,通过自主设计更多技术栈,可以更高效地提供更强大的智能服务,并推动先进AI走向更广泛的应用 [5][8] - 该芯片强化了OpenAI发展背后的飞轮效应:更完善的基础设施提升计算效率,进而驱动更强大的AI模型和更优质的产品,形成良性循环 [8] - 该平台是多代计算路线图的开端,旨在到2026年底进行初始部署,并在未来几年内不断扩展 [5][11] - 工作的重点是提升推理环节的成本、速度和可靠性,这将转化为更快的ChatGPT回答、更经济的API产品构建成本或更可靠的访问 [12] - 目标是实现人工智能民主化,让先进的模型变得足够易用、可靠且价格合理,以便更多人能够每天使用 [13]

OpenAI自研芯片,正式发布 - Reportify