OpenAI自研芯片，正式发布

文章核心观点 - OpenAI与博通联合发布了首款专为LLM推理设计的AI加速器Jalapeño，标志着OpenAI向构建全栈技术基础设施迈出重要一步，旨在通过自研硬件提升AI性能、可靠性与经济性，并计划从2026年开始部署千兆瓦级数据中心 [1][3][5][11] 产品设计与技术特点 - Jalapeño是OpenAI基于其对LLM基本原理及未来需求的深刻理解，从零开始设计的专用AI加速器，并非基于早期AI工作负载改造的通用加速器 [4][6] - 该芯片设计兼顾灵活性，能够与所有LLM兼容，其架构减少了数据传输，平衡了计算、内存和网络资源，使实际利用率更接近理论峰值性能 [4] - 早期测试表明，Jalapeño的每瓦性能将显著优于目前最先进的技术，一份详细的性能技术报告将在未来几个月内发布 [4] - 该芯片旨在将当今领先AI加速器的性能、吞吐量与接近最快专用推理系统的低延迟相结合，非常适合大规模交互式LLM产品 [6][7] 开发与生产合作 - 从最初设计到最终流片仅用了九个月，这得益于与OpenAI工程团队的深度软硬件联合开发、博通的芯片实现专长，以及利用OpenAI模型加速部分设计和优化流程 [9] - OpenAI与合作伙伴博通和Celestica携手，通过芯片实现、电路板和机架系统集成、高性能网络以及可扩展的生产系统，实现该平台的产业化 [4] - 博通的芯片实现和网络技术，包括Tomahawk网络芯片，助力该平台实现大规模量产 [4] 战略与行业影响 - Jalapeño是OpenAI长期全栈基础设施战略的一部分，通过自主设计更多技术栈，可以更高效地提供更强大的智能服务，并推动先进AI走向更广泛的应用 [5][8] - 该芯片强化了OpenAI发展背后的飞轮效应：更完善的基础设施提升计算效率，进而驱动更强大的AI模型和更优质的产品，形成良性循环 [8] - 该平台是多代计算路线图的开端，旨在到2026年底进行初始部署，并在未来几年内不断扩展 [5][11] - 工作的重点是提升推理环节的成本、速度和可靠性，这将转化为更快的ChatGPT回答、更经济的API产品构建成本或更可靠的访问 [12] - 目标是实现人工智能民主化，让先进的模型变得足够易用、可靠且价格合理，以便更多人能够每天使用 [13]