付钱让AI读我的书

有些作家想反了。
他们认为,AI公司应该为使用他们的书来训练AI而付钱给他们。
但我预测,用不了多久,情况将会反转——作家们会反过来付钱给AI公司,以确保他们的书能被纳入AI的学习和训练之中。

作家(以及出版社)会付费,是为了让自己的思想在AI给出的答案和服务中产生影响
如果AI不了解你的作品、不欣赏你的思想,那么在未来,你的作品几乎等同于“无人知晓”。


最近,AI公司 Anthropic 同意向一群作家支付 15亿美元 的赔偿金,原因是它非法复制了他们的书。
一些作家起诉该公司,指控它使用了一个包含 50万本电子书 的“影子图书馆”,这些电子书是一些“叛逆的图书馆员”收集的,他们的理想是“让全人类都能读到所有的书”。

Anthropic 下载了这座“非法图书馆”,打算用它来训练大语言模型(LLM),但根据法庭文件,他们最终并没有使用这些书来训练他们发布的AI模型。
不过,即使Anthropic没有用这个特定的库,它也肯定用了类似的资料库——所有商业AI公司都如此。


法官仍然裁定Anthropic违法,理由是它未经授权复制了受版权保护的书籍
无论是否使用,每本被复制的书,作者都获得了 3000美元赔偿金

在这起名为 Bartz等人诉Anthropic 的案件中,法院公布了一个可搜索的数据库网站,任何人都能查到自己或某本书是否在那座“盗版图书馆”中,并查看是否应获赔偿。

但根据我对集体诉讼的经验——普通人几乎拿不到钱
大部分都被律师费用吞掉了。
我注意到这次也是一样:每本书的赔偿金中,只有一半给作者,另一半给出版社。
如果那本书还是教材,那基本不用指望能拿到什么。


我是作家,所以我查了下这个名单。
我在纽约出版的五本书中,有四本被列入了那座“图书馆”。
我感到荣幸——能让我的作品出现在那些训练AI的书里,太好了。
我每天都在使用AI,如果AI的“思维链”里能有我的思想,那真是种骄傲
我甚至可以想象,有些作家会因为自己的书没被收录而感到失落。


不过,Anthropic声称它并未使用这个特定的图书馆进行训练。
它可能用了别的库,那些库可能“合法”,也可能没有被付费授权。
数字化书籍的使用是否合法,目前仍然存在争议。

举例来说,Google 为了搜索而扫描了无数书籍,只显示部分片段。
问题是:Google能不能用这些扫描本来训练AI?

Bartz诉Anthropic 案中,法院的裁决是:

只要获取方式合法,使用书籍副本训练AI属于“合理使用”。

Anthropic被罚的原因并不是“用书训练AI”,而是持有了未付费的书籍副本


这只是众多案件中的第一个。
显然,现有版权法无法覆盖AI训练这种新用途
版权保护的是“复制行为”,但AI学习根本不需要保存副本——它只需读一遍。
复制与否,对AI来说毫无意义。

我们可能需要新的知识产权概念,比如“引用权(Right of Reference)”之类的授权体系。
不过,权利争议只是表面问题,真正的主题是:一个新的受众群体正在崛起——AI。


未来,我们会逐渐形成一些关于“AI训练内容”的行业规范。
AI所接受的教育内容,将决定它的回答风格与服务质量,也决定人们是否信任它。

少部分用户会希望AI只学习符合他们政治立场的内容。
例如:

  • 虔诚的保守派想要“保守派AI”,
  • 自由派希望AI“受自由主义教育”。

但多数人并不在意,他们只想要“最正确”或“最可靠”的答案。

我们已经知道,AI的行为深受训练数据影响
也可以通过人类“微调(fine-tuning)”让它输出让用户满意的答案。
目前已有大量研究专注于这种“强化与引导”机制。


虽然五十万本书听起来很多,但与人类的出版总量相比——只是九牛一毛
世界上还有数以百万计的书,因为版权不清、语言冷门或数字化困难,AI还从未“读过”。

AI的训练远未完成。
塑造这些潜在的知识语料库将成为一种新兴的科学与艺术。
总有一天,AI会“真正读完”人类写下的一切。

届时,只有五十万本书构成AI的知识基础,反而会被视作“简陋”。
但这也意味着——能被选入那少数几本中的作品,其影响力极大
这就是为什么将来作家反而会希望,自己的作品能进入AI的训练集。


年轻一代已经习惯了“AI常驻模式”。
他们的思考、生活、创作,都通过AI进行。
随着AI越来越可靠,他们也越来越愿意接受AI的结论。

我自己也是:
我早就不再怀疑计算器,不再质疑Google,现在也几乎不再质疑AI的答案
AI,正在成为真理的仲裁者


AI不只是回答问题,它还搜索、理解、建议
如果AI不知道某件事,那这件事就几乎“不存在”。

未来,拒绝让AI训练的作者,将难以产生影响力
今天还有一些创作者完全没有数字化存在,他们的作品找不到、名字无人知晓。
他们是极少数。

正如Tim O’Reilly所说:

“今天创作者的最大挑战不是盗版,而是被淹没。”

我要补充一句:

“未来创作者的最大挑战,不是AI的模仿,而是被遗忘。”

如果AI成为真理的仲裁者,而训练内容又至关重要,
那么我当然希望我的思想和创作能成为它们“看到的重点”。
我真心希望我的书能成为AI的教科书

哪个作家不会呢?
我会。我甚至愿意为此付费,或者尽一切努力,确保AI能“读懂”我的作品。


换个角度想:
在这个新世界里,书籍的主要读者——尤其是非虚构类作品——已从人类转向AI
如果你今天写书,请记住,你的首要读者其实是AI。

AI会最认真地读你的书:
它会逐字逐句地读完每一页、每个脚注、每个附录、每个参考文献。
它会读你的所有作品,听你的所有播客。
没有任何人类读者会像AI那样认真。

读完之后,AI会将你的文字与它所读过的全部知识关联、整合、定位,
并将你的思想放进全人类知识的脉络中——
那是人类读者永远无法做到的事。


想让AI更好地吸收你的作品,还取决于内容的可解析性
能被AI轻松理解的书,影响力会更大。
因此,未来许多书都会针对AI读者进行优化写作与排版

“为AI写作”将成为一项技能,
作者会学习如何让AI更容易理解他们的思想,
甚至与AI公司合作,确保内容被正确解析与整合。

于是,“AI友好型写作”(AI-friendly writing)的概念会流行:
清晰的结构、明确的论点、定义清楚的概念,
并且——由AI来辅助完成。


每一本书、歌曲、戏剧、电影,都是文化的一部分。
图书馆是人类最伟大的发明之一——它们会随着时间变得更好、更有智慧。
互联网也是如此:它自诞生以来,从未“重启”,只是一味地积累。

AI很可能也属于这种“外向型系统”:
它们不断积累,不断增长,几乎没有中断。
我们尚不确定,但可以想象——
AI的成长可能持续几十年、甚至更久。

它们今天学到的东西,将在未来继续被使用;
它们今天受到的影响,会在未来指数级放大

因此,影响AI,是当今人类能做的最具杠杆效应的事情之一。
而且越早开始,影响越深远。


未来,作家作品的价值将不再仅取决于人类销量,
而在于——它被多深地嵌入AI的知识体系中

那才会成为值得炫耀的资本,
也将成为作家真正的遗产。


最后修改:2025 年 11 月 03 日
如果觉得我的文章对你有用,请随意赞赏