當地時間2026年6月24日,OpenAI與半導體巨頭博通聯合發佈了首款定製AI推理芯片Jalapeño,正式向外界披露了其多代計算平臺計劃。這是一款專為大語言模型推理設計的專用集成電路,旨在突破當前AI算力瓶頸,為OpenAI的長期基礎設施戰略奠定硬件基石。

Jalapeño的開發速度令人矚目。從最初設計到完成流片,整個項目僅耗時9個月。在這一過程中,OpenAI運用了自身的AI模型來加速芯片設計,展現了人工智能在半導體開發領域的應用潛力。分工方面,OpenAI主導底層架構設計,博通負責硅片實現與網絡硬件,而加拿大電子製造服務商Celestica則承擔板卡與機架系統的集成工作。

目前,Jalapeño的工程樣片已在實驗室中以量產目標頻率和功耗運行多種機器學習工作負載,包括GPT5.3CodexSpark等前沿模型。OpenAI方面表示,儘管最終性能仍在評估中,但早期測試結果表明,Jalapeño的每瓦性能將優於當前最先進水平。一份詳細的技術報告預計在未來幾個月內發佈。

從架構上看,Jalapeño通過減少數據移動,實現了計算、內存與網絡資源的均衡配置,使實際利用率更接近理論峰值性能。博通的硅實現與網絡技術,包括其Tomahawk網絡芯片,為平臺的大規模量產提供了關鍵支持。OpenAI總裁兼聯合創始人格雷格·布羅克曼強調,世界正邁向以計算為核心的經濟時代,Jalapeño是OpenAI長期全棧基礎設施戰略的一部分,通過自主設計更多底層技術棧,能夠以更高效率提供更強大的智能。

負責硬件項目的理查德・何指出,團隊圍繞對前沿AI模型最為關鍵的內核、內存傳輸、網絡及服務模式,對架構進行了全面優化。博通總裁兼首席執行官陳福陽則表示,這僅是一份跨越數代的路線圖的開端,通過與OpenAI共同研發芯片,博通正助力微軟及其他合作伙伴自2026年起部署千兆瓦級數據中心

Jalapeño的流片標誌著OpenAI打破了純軟件與算法層面的侷限,邁出了軟硬一體基礎設施建設的關鍵一步。回顧歷史,OpenAI在早期階段主要通過獨家綁定雲廠商,以資本換算力,例如接受微軟投資,租用由數萬枚NVIDIA GPU組成的微軟Azure專屬集群進行模型訓練與託管。到了2024年至2025年,OpenAI開始推動供應鏈多元化,在維持微軟核心合作的同時,與甲骨文等第三方雲服務商達成算力租賃協議,並在模型層面引入MRC協議,聯合AMD、博通、英特爾、NVIDIA及微軟,優化多芯片間的高速通信,以壓榨硬件極限。

OpenAI選擇在2026年中期推出Jalapeño,是高昂運營成本、市場競爭及供應鏈壓力交織的必然結果。當前,行業主流模型的推理端算力消耗已逐漸超過訓練端,擺脫對單一供應商的依賴成為眾多廠商的共同選擇。行業內,谷歌憑藉自研TPU系列芯片,在算力成本控制和軟硬協同優化上展現出巨大的利潤空間;Anthropic則與亞馬遜、谷歌深度資本與算力綁定,同時聯合多家硬件廠商搭建多元算力底座。OpenAI若要維持技術與商業領先,必須補齊芯片這塊拼圖。

OpenAI明確表示,Jalapeño是多代計算平臺的第一步,該平臺計劃於2026年底前實現首次部署,並在未來幾年持續擴展。這一戰略佈局不僅關乎OpenAI自身的成本效率,也可能對全球AI算力供應鏈產生深遠影響,推動行業從單純依賴通用GPU向定製化芯片解決方案演進。