一場圍繞AI與版權的世紀訴訟,在接近終點時,劇情卻轉向了意想不到的方向。AI明星公司Anthropic因使用盜版書籍訓練其大模型Claude,被一群作家告上法庭,最終同意支付15億美元的和解金。這本該是創作者對科技巨頭的一次標誌性勝利,但如今,聚光燈卻打在了原告律師的賬單上。
這場官司的起源並不複雜。2023年,有分析發現AI公司廣泛使用的訓練數據集“The Pile”中包含一個名為“Books3”的子集,內含近20萬冊圖書,且來源多為盜版網站。驚悚小說家安德里亞·巴茨發現自己的作品赫然在列,隨即聯合其他作者對Anthropic提起了集體訴訟。
隨著法庭文件的披露,Anthropic的所為遠超“使用公開數據集”的範疇。證據顯示,公司聯合創始人本傑明·曼恩在2021年親自從“Books3”下載了約19.6萬本書,隨後更開啟了一場“馬拉松式”下載:同年6月,他從盜版網站下載了至少500萬本盜版圖書。2022年,當一個新的盜版書網站上線,曼恩又下載了至少200萬本,並將鏈接分享給同事,附言“真是太及時了!!!”。內部郵件還顯示,CEO達里奧·阿莫代伊知曉此事,並將不尋求正版授權的理由歸結為“法律/實踐/商業上的繁瑣工作”。
2025年6月,法官作出簡易判決,認定Anthropic從已知盜版網站下載書籍的行為不受“合理使用”保護,每一次下載都構成侵權。隨後,雙方達成了15億美元的和解協議,Anthropic還需銷燬所有盜版書籍內容。這筆金額創下了美國版權訴訟史上的賠償紀錄。
然而,判決的另一部分卻為AI公司打開了另一扇窗。法官同時裁定,使用合法獲取的書籍訓練AI屬於“極具變革性”的合理使用行為。法官將AI訓練類比為人類閱讀與學習,認為不能要求人們為每次閱讀或引用付費。
這一裁定直接催生了Anthropic的“巴拿馬項目”。2026年1月曝光的材料顯示,Anthropic花費數千萬美元,在約一年時間內購買並破壞性地掃描了數百萬本實體書:員工將書脊切開,逐頁掃描,再將紙張送去回收。通過這種方式,公司獲得了大量“合法”的正版文本用於AI訓練。此舉引發了巨大爭議,支持者視其為AI發展的勝利,而作家和倫理學者則質疑將AI訓練與人類學習簡單類比是否妥當。
當版權歸屬的宏大敘事告一段落,更現實的利益分配問題浮出水面。15億美元的和解基金中,原告律師團隊最初要求分得20%,即3億美元,並稱這一比例已屬“保守”。這一要求立即遭到多方反對。Anthropic公司和法官均質疑律師未能提供詳細的工時記錄。參與訴訟的作者們更是感到不滿,因為算下來,每部被侵權作品僅能獲得約3000美元賠償,且作者還需與版權方分成。
面對壓力,律師團隊在2026年3月將費用比例降至12.5%,約1.875億美元。但在5月14日的最終審批聽證會上,仍有7位反對者對費用等問題提出質疑。儘管已有超過90%的作品接受了和解協議,預計最終結果不會再生變數,但這場訴訟的尾聲,無疑為整個事件增添了一抹荒誕的色彩。從捍衛創作尊嚴的起點,到圍繞律師費錙銖必較的終點,這場AI版權大戰留給業界的,遠不止一個判例那麼簡單。