OpenAI工程師自曝數月零手寫程式碼，AI Agent全流程接管開發

OpenAI團隊通過Harness Engineering實現全員零手寫程式碼，AI自主完成從需求到PR的全流程。

在AI程式設計助手日益普及的當下，OpenAI內部的一項實踐將這場變革推向了極致。工程師Ryan Lopopolo近期在一檔播客中披露，他所帶領的團隊已經連續數月執行一項鐵律：嚴禁任何人手寫一行程式碼。取而代之的，是一種被稱為“Harness Engineering”的全新工作模式，讓AI Agent全權負責程式碼的生成、測試與合併。

這項實踐的起點，是Lopopolo在2025年6月做出的一個激進決定。當時，連GPT-5模型都尚未釋出，團隊使用的還是能力相對有限的O3模型和初代Codex CLI工具。在那種條件下，完全依賴AI編碼的過程異常痛苦，Agent頻繁卡殼，最初只能反覆向人類求助。Lopopolo將這種痛苦視為契機，他開始系統性地觀察Agent的失敗模式，並通過構建自動化工具來逐一消除這些瓶頸，逐步建立對系統的信任。

“Harness Engineering”的核心思想，並非簡單地讓AI寫程式碼，而是構建一套嚴密的約束和引導體系。Lopopolo將其比喻為，要為AI鋪好一條生產高質量軟體的“金線”。團隊將大量關於程式碼風格、架構原則、常見錯誤等“非功能性需求”編寫成文件，並設計了一套機制，讓Agent在生成程式碼的恰當時刻能讀取到這些上下文。這不同於傳統的提示工程，它更強調利用工具呼叫對Agent進行動態的“提示注入”，用壓縮且語義豐富的自然語言指令，而非機械的錯誤日誌，來引導其修正行為。

這種模式帶來的效率提升是驚人的。隨著GPT-5系列模型的迭代，團隊人均每週處理的PR（Pull Request）數量從3.5個飆升至70個。更令人意外的是，新成員入職的磨合期被極大縮短。在傳統團隊中，新人通常需要一到三個月來吸收團隊的最佳實踐。而在Lopopolo的團隊，所有程式碼都通過Codex這個唯一入口生成，最佳實踐已經內化在程式碼庫的上下文裡。新成員無需手動學習，就能直接通過Agent產出符合團隊標準的高質量程式碼，並在入職頭兩週內就推動團隊整體吞吐量提升。

在程式碼審查環節，團隊同樣採取了激進策略：零人類程式碼審查。傳統的逐行程式碼審查被前置的高層設計審查所取代。團隊成員將精力集中在編寫精確的任務描述文件上，因為這份文件本質上就是給Agent的提示詞，其質量直接決定了最終產出。對於程式碼細節，團隊則依賴一套自動化的“反垃圾”迴圈系統。他們曾用一個積累了100到150條評論的GitHub議題作為種子，訓練Agent自動掃描整個程式碼庫，識別違背原則的“垃圾程式碼”，並自主提出修復PR。

Lopopolo強調，這種模式要求工程師的角色發生根本轉變。核心技能不再是編寫程式碼，而是系統思維：如何為團隊成功創造條件，如何預見問題、設計流程，以最快速度將程式碼交付給客戶。他將自己比作一個管絃樂隊的指揮，而非樂手，需要同時管理多達15個並行工作的Agent視窗。

當然，這套系統並非完全無人監督。對於複雜的跨周里程碑計劃，團隊仍保留傳統的人工預合併審查。同時，在最終釋出環節，團隊也維持著人工冒煙測試，以確保關鍵路徑的可靠性。Lopopolo認為，在程式碼生產成本極低的新範式下，允許Agent犯錯並從錯誤中學習，與培養人類工程師的邏輯並無二致。關鍵在於建立系統性的反饋閉環，讓每一次修復都能沉澱為組織的知識，從而讓整個開發體系持續進化。

OpenAI工程師自曝數月零手寫程式碼，AI Agent全流程接管開發

延伸閱讀

相關深度報道

相關每日新聞