OpenAI与博通(Broadcom)联合发布了其首款专属AI推理芯片Jalapeño,这标志着顶级AI实验室对算力控制权的争夺进入了自研芯片的新阶段。这款芯片专为大型语言模型(LLM)的推理任务而设计,旨在以更低的成本、更高的效率运行如ChatGPT等模型。
据两家公司在6月24日的联合声明,Jalapeño从初始设计到制造流片仅历时九个月,这在高性能先进半导体领域可能创下了最快的ASIC开发纪录。这一速度得益于OpenAI工程团队的软硬件协同开发、博通的芯片实现能力,以及OpenAI自身AI模型被反向用于加速芯片设计流程。早期测试数据显示,该芯片的每瓦性能“大幅优于当前最先进水平”,这意味着在同等算力输出下,其运营成本将显著降低。博通首席执行官Hock Tan更明确指出,新芯片可帮助节省50% 的成本。
Jalapeño并非对通用加速器的改造,而是围绕现代LLM推理进行了全新架构设计。它通过减少数据移动来提升性能,并针对顶级AI模型的计算、内存与网络资源使用模式进行专项优化,旨在单一架构中同时实现高吞吐量与低延迟。OpenAI硬件项目负责人Richard Ho表示,尽管当前聚焦推理,但这仍是一款“非常通用的设备”,能够应对未来的LLM创新。
在部署规划上,Jalapeño的工程样片已在实验室以生产目标频率和功耗运行包括GPT-5.3-Codex-Spark在内的机器学习任务。首批芯片计划于2026年底开始在数据中心合作伙伴处进行吉瓦级规模部署,合作方包括微软。博通CEO Hock Tan确认,双方已制定多代芯片路线图,下一代产品预计2028年推出,此后将保持每年迭代一次的节奏。
此次合作背后,是OpenAI将基础设施控制权从产品与模型层延伸至芯片层的战略意图。Richard Ho将此定位为OpenAI“对所有基础设施层级施加控制”一系列举措的起点。OpenAI总裁Greg Brockman则强调,这是其“长期全栈基础设施战略”的一部分,目标是使算力更加充裕,让AI变得“更快、更可靠、更实惠”。
从行业视角看,Hock Tan做出了一个更广泛的预判:随着时间推移,每一家前沿模型创造者都将打造其专属的AI加速器。这一趋势若成为现实,将可能对当前由通用GPU主导的AI算力市场格局带来深层的结构性重塑。对于OpenAI而言,自研芯片不仅关乎技术自主,也是其今年早些时候完成的1220亿美元融资中,用于支持芯片、数据中心和人才方面高额投入的关键落子。
此次发布会的交付仪式上,博通总裁兼首席执行官Hock Tan与半导体解决方案总裁Charlie Kawwas,将首批芯片交付给了OpenAI首席执行官Sam Altman与总裁Greg Brockman。除博通外,Celestica也参与了电路板、机架、系统集成及可扩展生产系统的开发,共同推动该平台走向大规模量产。关于外部开放性,OpenAI表示将对是否允许其他模型厂商使用该芯片保持灵活态度。