在AI編程助手日益普及的當下,OpenAI內部的一項實踐將這場變革推向了極致。工程師Ryan Lopopolo近期在一檔播客中披露,他所帶領的團隊已經連續數月執行一項鐵律:嚴禁任何人手寫一行代碼。取而代之的,是一種被稱為“Harness Engineering”的全新工作模式,讓AI Agent全權負責代碼的生成、測試與合併。

這項實踐的起點,是Lopopolo在2025年6月做出的一個激進決定。當時,連GPT-5模型都尚未發佈,團隊使用的還是能力相對有限的O3模型和初代Codex CLI工具。在那種條件下,完全依賴AI編碼的過程異常痛苦,Agent頻繁卡殼,最初只能反覆向人類求助。Lopopolo將這種痛苦視為契機,他開始系統性地觀察Agent的失敗模式,並通過構建自動化工具來逐一消除這些瓶頸,逐步建立對系統的信任。

“Harness Engineering”的核心思想,並非簡單地讓AI寫代碼,而是構建一套嚴密的約束和引導體系。Lopopolo將其比喻為,要為AI鋪好一條生產高質量軟件的“金線”。團隊將大量關於代碼風格、架構原則、常見錯誤等“非功能性需求”編寫成文檔,並設計了一套機制,讓Agent在生成代碼的恰當時刻能讀取到這些上下文。這不同於傳統的提示工程,它更強調利用工具調用對Agent進行動態的“提示注入”,用壓縮且語義豐富的自然語言指令,而非機械的錯誤日誌,來引導其修正行為。

這種模式帶來的效率提升是驚人的。隨著GPT-5系列模型的迭代,團隊人均每週處理的PR(Pull Request)數量從3.5個飆升至70個。更令人意外的是,新成員入職的磨合期被極大縮短。在傳統團隊中,新人通常需要一到三個月來吸收團隊的最佳實踐。而在Lopopolo的團隊,所有代碼都通過Codex這個唯一入口生成,最佳實踐已經內化在代碼庫的上下文裡。新成員無需手動學習,就能直接通過Agent產出符合團隊標準的高質量代碼,並在入職頭兩週內就推動團隊整體吞吐量提升。

在代碼審查環節,團隊同樣採取了激進策略:零人類代碼審查。傳統的逐行代碼審查被前置的高層設計審查所取代。團隊成員將精力集中在編寫精確的任務描述文檔上,因為這份文檔本質上就是給Agent的提示詞,其質量直接決定了最終產出。對於代碼細節,團隊則依賴一套自動化的“反垃圾”循環系統。他們曾用一個積累了100到150條評論的GitHub議題作為種子,訓練Agent自動掃描整個代碼庫,識別違背原則的“垃圾代碼”,並自主提出修復PR。

Lopopolo強調,這種模式要求工程師的角色發生根本轉變。核心技能不再是編寫代碼,而是系統思維:如何為團隊成功創造條件,如何預見問題、設計流程,以最快速度將代碼交付給客戶。他將自己比作一個管絃樂隊的指揮,而非樂手,需要同時管理多達15個並行工作的Agent窗口。

當然,這套系統並非完全無人監督。對於複雜的跨周里程碑計劃,團隊仍保留傳統的人工預合併審查。同時,在最終發佈環節,團隊也維持著人工冒煙測試,以確保關鍵路徑的可靠性。Lopopolo認為,在代碼生產成本極低的新範式下,允許Agent犯錯並從錯誤中學習,與培養人類工程師的邏輯並無二致。關鍵在於建立系統性的反饋閉環,讓每一次修復都能沉澱為組織的知識,從而讓整個開發體系持續進化。