当地时间2026年6月24日,OpenAI与半导体巨头博通联合发布了首款定制AI推理芯片Jalapeño,正式向外界披露了其多代计算平台计划。这是一款专为大语言模型推理设计的专用集成电路,旨在突破当前AI算力瓶颈,为OpenAI的长期基础设施战略奠定硬件基石。
Jalapeño的开发速度令人瞩目。从最初设计到完成流片,整个项目仅耗时9个月。在这一过程中,OpenAI运用了自身的AI模型来加速芯片设计,展现了人工智能在半导体开发领域的应用潜力。分工方面,OpenAI主导底层架构设计,博通负责硅片实现与网络硬件,而加拿大电子制造服务商Celestica则承担板卡与机架系统的集成工作。
目前,Jalapeño的工程样片已在实验室中以量产目标频率和功耗运行多种机器学习工作负载,包括GPT5.3、Codex和Spark等前沿模型。OpenAI方面表示,尽管最终性能仍在评估中,但早期测试结果表明,Jalapeño的每瓦性能将优于当前最先进水平。一份详细的技术报告预计在未来几个月内发布。
从架构上看,Jalapeño通过减少数据移动,实现了计算、内存与网络资源的均衡配置,使实际利用率更接近理论峰值性能。博通的硅实现与网络技术,包括其Tomahawk网络芯片,为平台的大规模量产提供了关键支持。OpenAI总裁兼联合创始人格雷格·布罗克曼强调,世界正迈向以计算为核心的经济时代,Jalapeño是OpenAI长期全栈基础设施战略的一部分,通过自主设计更多底层技术栈,能够以更高效率提供更强大的智能。
负责硬件项目的理查德・何指出,团队围绕对前沿AI模型最为关键的内核、内存传输、网络及服务模式,对架构进行了全面优化。博通总裁兼首席执行官陈福阳则表示,这仅是一份跨越数代的路线图的开端,通过与OpenAI共同研发芯片,博通正助力微软及其他合作伙伴自2026年起部署千兆瓦级数据中心。
Jalapeño的流片标志着OpenAI打破了纯软件与算法层面的局限,迈出了软硬一体基础设施建设的关键一步。回顾历史,OpenAI在早期阶段主要通过独家绑定云厂商,以资本换算力,例如接受微软投资,租用由数万枚NVIDIA GPU组成的微软Azure专属集群进行模型训练与托管。到了2024年至2025年,OpenAI开始推动供应链多元化,在维持微软核心合作的同时,与甲骨文等第三方云服务商达成算力租赁协议,并在模型层面引入MRC协议,联合AMD、博通、英特尔、NVIDIA及微软,优化多芯片间的高速通信,以压榨硬件极限。
OpenAI选择在2026年中期推出Jalapeño,是高昂运营成本、市场竞争及供应链压力交织的必然结果。当前,行业主流模型的推理端算力消耗已逐渐超过训练端,摆脱对单一供应商的依赖成为众多厂商的共同选择。行业内,谷歌凭借自研TPU系列芯片,在算力成本控制和软硬协同优化上展现出巨大的利润空间;Anthropic则与亚马逊、谷歌深度资本与算力绑定,同时联合多家硬件厂商搭建多元算力底座。OpenAI若要维持技术与商业领先,必须补齐芯片这块拼图。
OpenAI明确表示,Jalapeño是多代计算平台的第一步,该平台计划于2026年底前实现首次部署,并在未来几年持续扩展。这一战略布局不仅关乎OpenAI自身的成本效率,也可能对全球AI算力供应链产生深远影响,推动行业从单纯依赖通用GPU向定制化芯片解决方案演进。