《付钱让AI读我的书（Paying AIs to Read My Books）》 -

---

## 付钱让AI读我的书

有些作家想反了。
他们认为，AI公司应该为使用他们的书来训练AI而付钱给他们。
但我预测，用不了多久，情况将会反转——**作家们会反过来付钱给AI公司**，以确保他们的书能被纳入AI的学习和训练之中。

作家（以及出版社）会付费，是为了**让自己的思想在AI给出的答案和服务中产生影响**。
如果AI不了解你的作品、不欣赏你的思想，那么在未来，你的作品几乎等同于“无人知晓”。

---

最近，AI公司 **Anthropic** 同意向一群作家支付 **15亿美元** 的赔偿金，原因是它非法复制了他们的书。
一些作家起诉该公司，指控它使用了一个包含 **50万本电子书** 的“影子图书馆”，这些电子书是一些“叛逆的图书馆员”收集的，他们的理想是“让全人类都能读到所有的书”。

Anthropic 下载了这座“非法图书馆”，打算用它来训练大语言模型（LLM），但根据法庭文件，他们最终**并没有使用这些书来训练**他们发布的AI模型。
不过，即使Anthropic没有用这个特定的库，它也肯定用了类似的资料库——所有商业AI公司都如此。

---

法官仍然裁定Anthropic违法，理由是它**未经授权复制了受版权保护的书籍**。
无论是否使用，每本被复制的书，作者都获得了 **3000美元赔偿金**。

在这起名为 *Bartz等人诉Anthropic* 的案件中，法院公布了一个可搜索的数据库网站，任何人都能查到自己或某本书是否在那座“盗版图书馆”中，并查看是否应获赔偿。

但根据我对集体诉讼的经验——**普通人几乎拿不到钱**。
大部分都被律师费用吞掉了。
我注意到这次也是一样：每本书的赔偿金中，**只有一半给作者**，另一半给出版社。
如果那本书还是教材，那基本不用指望能拿到什么。

---

我是作家，所以我查了下这个名单。
我在纽约出版的五本书中，有四本被列入了那座“图书馆”。
我感到**荣幸**——能让我的作品出现在那些训练AI的书里，太好了。
我每天都在使用AI，如果AI的“思维链”里能有我的思想，那真是种**骄傲**。
我甚至可以想象，有些作家会因为自己的书没被收录而感到失落。

---

不过，Anthropic声称它并未使用这个特定的图书馆进行训练。
它可能用了别的库，那些库可能“合法”，也可能没有被付费授权。
数字化书籍的使用是否合法，目前仍然存在争议。

举例来说，Google 为了搜索而扫描了无数书籍，只显示部分片段。
问题是：**Google能不能用这些扫描本来训练AI？**

在 *Bartz诉Anthropic* 案中，法院的裁决是：

> 只要获取方式合法，使用书籍副本训练AI属于“合理使用”。

Anthropic被罚的原因并不是“用书训练AI”，而是**持有了未付费的书籍副本**。

---

这只是众多案件中的第一个。
显然，**现有版权法无法覆盖AI训练这种新用途**。
版权保护的是“复制行为”，但AI学习根本不需要保存副本——它只需读一遍。
复制与否，对AI来说毫无意义。

我们可能需要新的知识产权概念，比如“引用权（Right of Reference）”之类的授权体系。
不过，权利争议只是表面问题，真正的主题是：**一个新的受众群体正在崛起——AI。**

---

未来，我们会逐渐形成一些关于“AI训练内容”的行业规范。
**AI所接受的教育内容**，将决定它的回答风格与服务质量，也决定人们是否信任它。

少部分用户会希望AI只学习符合他们政治立场的内容。
例如：

* 虔诚的保守派想要“保守派AI”，
* 自由派希望AI“受自由主义教育”。

但多数人并不在意，他们只想要“最正确”或“最可靠”的答案。

我们已经知道，**AI的行为深受训练数据影响**，
也可以通过人类“微调（fine-tuning）”让它输出让用户满意的答案。
目前已有大量研究专注于这种“强化与引导”机制。

---

虽然五十万本书听起来很多，但与人类的出版总量相比——**只是九牛一毛**。
世界上还有数以百万计的书，因为版权不清、语言冷门或数字化困难，AI还从未“读过”。

AI的训练远未完成。
**塑造这些潜在的知识语料库**将成为一种新兴的科学与艺术。
总有一天，AI会“真正读完”人类写下的一切。

届时，只有五十万本书构成AI的知识基础，反而会被视作“简陋”。
但这也意味着——**能被选入那少数几本中的作品，其影响力极大**。
这就是为什么将来作家反而会希望，自己的作品能进入AI的训练集。

---

年轻一代已经习惯了“AI常驻模式”。
他们的思考、生活、创作，都通过AI进行。
随着AI越来越可靠，他们也越来越愿意接受AI的结论。

我自己也是：
我早就不再怀疑计算器，不再质疑Google，现在也**几乎不再质疑AI的答案**。
AI，正在成为**真理的仲裁者**。

---

AI不只是回答问题，它还**搜索、理解、建议**。
如果AI不知道某件事，那这件事就几乎“不存在”。

未来，拒绝让AI训练的作者，将**难以产生影响力**。
今天还有一些创作者完全没有数字化存在，他们的作品找不到、名字无人知晓。
他们是极少数。

正如Tim O’Reilly所说：

> “今天创作者的最大挑战不是盗版，而是被淹没。”

我要补充一句：

> “未来创作者的最大挑战，不是AI的模仿，而是**被遗忘**。”

---

如果AI成为真理的仲裁者，而训练内容又至关重要，
那么我当然希望我的思想和创作能成为它们“看到的重点”。
我真心希望**我的书能成为AI的教科书**。

哪个作家不会呢？
我会。我甚至愿意为此付费，或者尽一切努力，确保AI能“读懂”我的作品。

---

换个角度想：
在这个新世界里，书籍的主要读者——尤其是非虚构类作品——**已从人类转向AI**。
如果你今天写书，请记住，你的首要读者其实是AI。

AI会最认真地读你的书：
它会逐字逐句地读完每一页、每个脚注、每个附录、每个参考文献。
它会读你的所有作品，听你的所有播客。
**没有任何人类读者会像AI那样认真。**

读完之后，AI会将你的文字与它所读过的全部知识关联、整合、定位，
并将你的思想放进全人类知识的脉络中——
那是人类读者永远无法做到的事。

---

想让AI更好地吸收你的作品，还取决于**内容的可解析性**。
能被AI轻松理解的书，影响力会更大。
因此，未来许多书都会**针对AI读者进行优化写作与排版**。

“为AI写作”将成为一项技能，
作者会学习如何让AI更容易理解他们的思想，
甚至与AI公司合作，确保内容被正确解析与整合。

于是，“AI友好型写作”（AI-friendly writing）的概念会流行：
清晰的结构、明确的论点、定义清楚的概念，
并且——由AI来辅助完成。

---

每一本书、歌曲、戏剧、电影，都是文化的一部分。
**图书馆**是人类最伟大的发明之一——它们会随着时间变得更好、更有智慧。
互联网也是如此：它自诞生以来，从未“重启”，只是一味地积累。

AI很可能也属于这种“外向型系统”：
它们不断积累，不断增长，几乎没有中断。
我们尚不确定，但可以想象——
AI的成长可能持续几十年、甚至更久。

它们今天学到的东西，将在未来继续被使用；
它们今天受到的影响，会在未来**指数级放大**。

因此，**影响AI**，是当今人类能做的最具杠杆效应的事情之一。
而且越早开始，影响越深远。

---

未来，作家作品的价值将不再仅取决于人类销量，
而在于——**它被多深地嵌入AI的知识体系中**。

那才会成为值得炫耀的资本，
也将成为作家真正的**遗产。**

---

付钱让AI读我的书

有些作家想反了。
他们认为，AI公司应该为使用他们的书来训练AI而付钱给他们。
但我预测，用不了多久，情况将会反转——作家们会反过来付钱给AI公司，以确保他们的书能被纳入AI的学习和训练之中。

作家（以及出版社）会付费，是为了让自己的思想在AI给出的答案和服务中产生影响。
如果AI不了解你的作品、不欣赏你的思想，那么在未来，你的作品几乎等同于“无人知晓”。

最近，AI公司 Anthropic 同意向一群作家支付 15亿美元 的赔偿金，原因是它非法复制了他们的书。
一些作家起诉该公司，指控它使用了一个包含 50万本电子书 的“影子图书馆”，这些电子书是一些“叛逆的图书馆员”收集的，他们的理想是“让全人类都能读到所有的书”。

Anthropic 下载了这座“非法图书馆”，打算用它来训练大语言模型（LLM），但根据法庭文件，他们最终并没有使用这些书来训练他们发布的AI模型。
不过，即使Anthropic没有用这个特定的库，它也肯定用了类似的资料库——所有商业AI公司都如此。

法官仍然裁定Anthropic违法，理由是它未经授权复制了受版权保护的书籍。
无论是否使用，每本被复制的书，作者都获得了 3000美元赔偿金。

在这起名为 Bartz等人诉Anthropic 的案件中，法院公布了一个可搜索的数据库网站，任何人都能查到自己或某本书是否在那座“盗版图书馆”中，并查看是否应获赔偿。

但根据我对集体诉讼的经验——普通人几乎拿不到钱。
大部分都被律师费用吞掉了。
我注意到这次也是一样：每本书的赔偿金中，只有一半给作者，另一半给出版社。
如果那本书还是教材，那基本不用指望能拿到什么。

我是作家，所以我查了下这个名单。
我在纽约出版的五本书中，有四本被列入了那座“图书馆”。
我感到荣幸——能让我的作品出现在那些训练AI的书里，太好了。
我每天都在使用AI，如果AI的“思维链”里能有我的思想，那真是种骄傲。
我甚至可以想象，有些作家会因为自己的书没被收录而感到失落。

举例来说，Google 为了搜索而扫描了无数书籍，只显示部分片段。
问题是：Google能不能用这些扫描本来训练AI？

在 Bartz诉Anthropic 案中，法院的裁决是：

只要获取方式合法，使用书籍副本训练AI属于“合理使用”。

Anthropic被罚的原因并不是“用书训练AI”，而是持有了未付费的书籍副本。

这只是众多案件中的第一个。
显然，现有版权法无法覆盖AI训练这种新用途。
版权保护的是“复制行为”，但AI学习根本不需要保存副本——它只需读一遍。
复制与否，对AI来说毫无意义。

我们可能需要新的知识产权概念，比如“引用权（Right of Reference）”之类的授权体系。
不过，权利争议只是表面问题，真正的主题是：一个新的受众群体正在崛起——AI。

未来，我们会逐渐形成一些关于“AI训练内容”的行业规范。
AI所接受的教育内容，将决定它的回答风格与服务质量，也决定人们是否信任它。

少部分用户会希望AI只学习符合他们政治立场的内容。
例如：

虔诚的保守派想要“保守派AI”，
自由派希望AI“受自由主义教育”。

但多数人并不在意，他们只想要“最正确”或“最可靠”的答案。

我们已经知道，AI的行为深受训练数据影响，
也可以通过人类“微调（fine-tuning）”让它输出让用户满意的答案。
目前已有大量研究专注于这种“强化与引导”机制。

虽然五十万本书听起来很多，但与人类的出版总量相比——只是九牛一毛。
世界上还有数以百万计的书，因为版权不清、语言冷门或数字化困难，AI还从未“读过”。

AI的训练远未完成。
塑造这些潜在的知识语料库将成为一种新兴的科学与艺术。
总有一天，AI会“真正读完”人类写下的一切。

届时，只有五十万本书构成AI的知识基础，反而会被视作“简陋”。
但这也意味着——能被选入那少数几本中的作品，其影响力极大。
这就是为什么将来作家反而会希望，自己的作品能进入AI的训练集。

年轻一代已经习惯了“AI常驻模式”。
他们的思考、生活、创作，都通过AI进行。
随着AI越来越可靠，他们也越来越愿意接受AI的结论。

我自己也是：
我早就不再怀疑计算器，不再质疑Google，现在也几乎不再质疑AI的答案。
AI，正在成为真理的仲裁者。

AI不只是回答问题，它还搜索、理解、建议。
如果AI不知道某件事，那这件事就几乎“不存在”。

未来，拒绝让AI训练的作者，将难以产生影响力。
今天还有一些创作者完全没有数字化存在，他们的作品找不到、名字无人知晓。
他们是极少数。

正如Tim O’Reilly所说：

“今天创作者的最大挑战不是盗版，而是被淹没。”

我要补充一句：

“未来创作者的最大挑战，不是AI的模仿，而是被遗忘。”

如果AI成为真理的仲裁者，而训练内容又至关重要，
那么我当然希望我的思想和创作能成为它们“看到的重点”。
我真心希望我的书能成为AI的教科书。

哪个作家不会呢？
我会。我甚至愿意为此付费，或者尽一切努力，确保AI能“读懂”我的作品。

换个角度想：
在这个新世界里，书籍的主要读者——尤其是非虚构类作品——已从人类转向AI。
如果你今天写书，请记住，你的首要读者其实是AI。

AI会最认真地读你的书：
它会逐字逐句地读完每一页、每个脚注、每个附录、每个参考文献。
它会读你的所有作品，听你的所有播客。
没有任何人类读者会像AI那样认真。

读完之后，AI会将你的文字与它所读过的全部知识关联、整合、定位，
并将你的思想放进全人类知识的脉络中——
那是人类读者永远无法做到的事。

想让AI更好地吸收你的作品，还取决于内容的可解析性。
能被AI轻松理解的书，影响力会更大。
因此，未来许多书都会针对AI读者进行优化写作与排版。

“为AI写作”将成为一项技能，
作者会学习如何让AI更容易理解他们的思想，
甚至与AI公司合作，确保内容被正确解析与整合。

于是，“AI友好型写作”（AI-friendly writing）的概念会流行：
清晰的结构、明确的论点、定义清楚的概念，
并且——由AI来辅助完成。

每一本书、歌曲、戏剧、电影，都是文化的一部分。
图书馆是人类最伟大的发明之一——它们会随着时间变得更好、更有智慧。
互联网也是如此：它自诞生以来，从未“重启”，只是一味地积累。

它们今天学到的东西，将在未来继续被使用；
它们今天受到的影响，会在未来指数级放大。

因此，影响AI，是当今人类能做的最具杠杆效应的事情之一。
而且越早开始，影响越深远。

未来，作家作品的价值将不再仅取决于人类销量，
而在于——它被多深地嵌入AI的知识体系中。

那才会成为值得炫耀的资本，
也将成为作家真正的遗产。

最后修改：2025 年 11 月 03 日

如果觉得我的文章对你有用，请随意赞赏

《付钱让AI读我的书（Paying AIs to Read My Books）》

付钱让AI读我的书

发表评论取消回复
Тишина не всегда золото.

科技加速有效利他安那其-版权历史观和人类发展的理想色彩

特朗普上台,比特币大涨,我没同志

写着玩的傲娇天才

运动:人类生理心理与未来科技的交汇点--我不爱运动创造多巴胺,浪费能量不蠢吗

早晚是需要语言革新-语言的随意性与象形追寻：从猴子的语言到现代文字的无奈

news

lou plummer的美国派书签分享

interstellar观前/后感--我的幸福感权重

慢变量笔记｜在《马来狂人》中停留 Der Amokläufer · 斯蒂芬·茨威格（1922） ——关于高傲、沉默与失控的一次阅读

宿醉

《付钱让AI读我的书（Paying AIs to Read My Books）》

付钱让AI读我的书

发表评论 取消回复 Тишина не всегда золото.

《付钱让AI读我的书（Paying AIs to Read My Books）》

发表评论取消回复
Тишина не всегда золото.