OpenAI與博通(Broadcom)聯合發佈了其首款專屬AI推理芯片Jalapeño,這標誌著頂級AI實驗室對算力控制權的爭奪進入了自研芯片的新階段。這款芯片專為大型語言模型(LLM)的推理任務而設計,旨在以更低的成本、更高的效率運行如ChatGPT等模型。
據兩家公司在6月24日的聯合聲明,Jalapeño從初始設計到製造流片僅歷時九個月,這在高性能先進半導體領域可能創下了最快的ASIC開發紀錄。這一速度得益於OpenAI工程團隊的軟硬件協同開發、博通的芯片實現能力,以及OpenAI自身AI模型被反向用於加速芯片設計流程。早期測試數據顯示,該芯片的每瓦性能“大幅優於當前最先進水平”,這意味著在同等算力輸出下,其運營成本將顯著降低。博通首席執行官Hock Tan更明確指出,新芯片可幫助節省50% 的成本。
Jalapeño並非對通用加速器的改造,而是圍繞現代LLM推理進行了全新架構設計。它通過減少數據移動來提升性能,並針對頂級AI模型的計算、內存與網絡資源使用模式進行專項優化,旨在單一架構中同時實現高吞吐量與低延遲。OpenAI硬件項目負責人Richard Ho表示,儘管當前聚焦推理,但這仍是一款“非常通用的設備”,能夠應對未來的LLM創新。
在部署規劃上,Jalapeño的工程樣片已在實驗室以生產目標頻率和功耗運行包括GPT-5.3-Codex-Spark在內的機器學習任務。首批芯片計劃於2026年底開始在數據中心合作伙伴處進行吉瓦級規模部署,合作方包括微軟。博通CEO Hock Tan確認,雙方已制定多代芯片路線圖,下一代產品預計2028年推出,此後將保持每年迭代一次的節奏。
此次合作背後,是OpenAI將基礎設施控制權從產品與模型層延伸至芯片層的戰略意圖。Richard Ho將此定位為OpenAI“對所有基礎設施層級施加控制”一系列舉措的起點。OpenAI總裁Greg Brockman則強調,這是其“長期全棧基礎設施戰略”的一部分,目標是使算力更加充裕,讓AI變得“更快、更可靠、更實惠”。
從行業視角看,Hock Tan做出了一個更廣泛的預判:隨著時間推移,每一家前沿模型創造者都將打造其專屬的AI加速器。這一趨勢若成為現實,將可能對當前由通用GPU主導的AI算力市場格局帶來深層的結構性重塑。對於OpenAI而言,自研芯片不僅關乎技術自主,也是其今年早些時候完成的1220億美元融資中,用於支持芯片、數據中心和人才方面高額投入的關鍵落子。
此次發佈會的交付儀式上,博通總裁兼首席執行官Hock Tan與半導體解決方案總裁Charlie Kawwas,將首批芯片交付給了OpenAI首席執行官Sam Altman與總裁Greg Brockman。除博通外,Celestica也參與了電路板、機架、系統集成及可擴展生產系統的開發,共同推動該平臺走向大規模量產。關於外部開放性,OpenAI表示將對是否允許其他模型廠商使用該芯片保持靈活態度。