一场围绕AI与版权的世纪诉讼,在接近终点时,剧情却转向了意想不到的方向。AI明星公司Anthropic因使用盗版书籍训练其大模型Claude,被一群作家告上法庭,最终同意支付15亿美元的和解金。这本该是创作者对科技巨头的一次标志性胜利,但如今,聚光灯却打在了原告律师的账单上。

这场官司的起源并不复杂。2023年,有分析发现AI公司广泛使用的训练数据集“The Pile”中包含一个名为“Books3”的子集,内含近20万册图书,且来源多为盗版网站。惊悚小说家安德里亚·巴茨发现自己的作品赫然在列,随即联合其他作者对Anthropic提起了集体诉讼。

随着法庭文件的披露,Anthropic的所为远超“使用公开数据集”的范畴。证据显示,公司联合创始人本杰明·曼恩在2021年亲自从“Books3”下载了约19.6万本书,随后更开启了一场“马拉松式”下载:同年6月,他从盗版网站下载了至少500万本盗版图书。2022年,当一个新的盗版书网站上线,曼恩又下载了至少200万本,并将链接分享给同事,附言“真是太及时了!!!”。内部邮件还显示,CEO达里奥·阿莫代伊知晓此事,并将不寻求正版授权的理由归结为“法律/实践/商业上的繁琐工作”。

2025年6月,法官作出简易判决,认定Anthropic从已知盗版网站下载书籍的行为不受“合理使用”保护,每一次下载都构成侵权。随后,双方达成了15亿美元的和解协议,Anthropic还需销毁所有盗版书籍内容。这笔金额创下了美国版权诉讼史上的赔偿纪录

然而,判决的另一部分却为AI公司打开了另一扇窗。法官同时裁定,使用合法获取的书籍训练AI属于“极具变革性”的合理使用行为。法官将AI训练类比为人类阅读与学习,认为不能要求人们为每次阅读或引用付费。

这一裁定直接催生了Anthropic的“巴拿马项目”。2026年1月曝光的材料显示,Anthropic花费数千万美元,在约一年时间内购买并破坏性地扫描了数百万本实体书:员工将书脊切开,逐页扫描,再将纸张送去回收。通过这种方式,公司获得了大量“合法”的正版文本用于AI训练。此举引发了巨大争议,支持者视其为AI发展的胜利,而作家和伦理学者则质疑将AI训练与人类学习简单类比是否妥当。

当版权归属的宏大叙事告一段落,更现实的利益分配问题浮出水面。15亿美元的和解基金中,原告律师团队最初要求分得20%,即3亿美元,并称这一比例已属“保守”。这一要求立即遭到多方反对。Anthropic公司和法官均质疑律师未能提供详细的工时记录。参与诉讼的作者们更是感到不满,因为算下来,每部被侵权作品仅能获得约3000美元赔偿,且作者还需与版权方分成。

面对压力,律师团队在2026年3月将费用比例降至12.5%,约1.875亿美元。但在5月14日的最终审批听证会上,仍有7位反对者对费用等问题提出质疑。尽管已有超过90%的作品接受了和解协议,预计最终结果不会再生变数,但这场诉讼的尾声,无疑为整个事件增添了一抹荒诞的色彩。从捍卫创作尊严的起点,到围绕律师费锱铢必较的终点,这场AI版权大战留给业界的,远不止一个判例那么简单。