互联网档案馆对版权局的人工智能发表看法
Posted: Sat Jul 05, 2025 6:54 am
美国版权政策的制定往往被现有的版权产业所主导。正如杰西卡·利特曼教授在最近的互联网档案馆新书演讲中所解释的那样,20世纪的版权法在很大程度上是“由版权的受益者产业制定的”,以维护其经济利益。利特曼教授写道,在这种情况下,版权局“在管理多边谈判和向国会解释谈判结果方面发挥着至关重要的作用”。在历史上的不同时期,版权局都有机会利用这一角色来平衡政策制定过程。
互联网档案馆始终乐见版权局邀请各方声音参与版权政策讨论,并积极参与其中。本月早些时候,我们参加了美国版权局举办的一场关于版权与人工智能的会议。这是版权局在2023年上半年举办的一系列会议中的第一场,该局将致力于推进其“旨在审查人工智能 (AI) 技术引发的版权法和政策问题的倡议”。
正如我们在活动中所解释的那样,创新的机器学习和人工智能技术已经在帮助我们构建图书馆。例如,通过引入长短期记忆(LS TM)技术,我们对文本(包括此前从未数字化的政府文件)的数字化流程得到了显著改进。最先进的人工智能工具也帮助我们完善了拥有百年历史的78转唱片的收藏。政策 海外数据 制定者们对面向消费者的人工智能的最新发展感到眼花缭乱,他们不应忘记,这项通用技术还有其他用途——其中许多用途超出了传统版权行业的商业范围——但它们仍然服务于版权的宗旨:“促进而不是阻碍知识的获取。”
传统的版权政策制定也经常将开放许可的世界排除在外或忽视。但在这个新领域,许多工具来自开源社区,大量数据来自维基百科或Flickr Commons等开放许可来源。声称代表作者声音的行业组织通常并不代表这些创作者,他们提出的解决方案——通常要求向企业出版商或集体权利管理组织支付费用——往往不利于开放世界的理念,并且与开放世界的理念相悖。
此外,即使除了公开授权的资料之外,开放网络上还有大量技术上受版权保护但未进行主动权利管理的内容;这些内容也用于训练人工智能模型。数百万甚至数十亿个人为这些数据源做出了贡献,而且由于他们中没有人需要注册其作品才能获得版权,因此在继续开发之前试图识别所有相关的版权所有者似乎是不可能的,也是不明智的——更不用说与他们一一协商了。认识到这些问题以及其他各种担忧,欧盟已经将版权例外编入法典,允许使用受版权保护的资料作为生成式人工智能模型的训练数据,但在商业情况下可以选择退出,并可能承担新的透明度义务。
诚然,人们对生成性人工智能可能如何影响创意工作者并造成其他危害的担忧是合理的。但版权政策制定者必须认识到,人工智能技术具有巨大潜力,能够推动科学和实用艺术的进步。根据美国版权法,允许机器人阅读既合理又合法。让我们确保利特曼教授所描述的过程不会妨碍构建人人可用的人工智能工具。
互联网档案馆始终乐见版权局邀请各方声音参与版权政策讨论,并积极参与其中。本月早些时候,我们参加了美国版权局举办的一场关于版权与人工智能的会议。这是版权局在2023年上半年举办的一系列会议中的第一场,该局将致力于推进其“旨在审查人工智能 (AI) 技术引发的版权法和政策问题的倡议”。
正如我们在活动中所解释的那样,创新的机器学习和人工智能技术已经在帮助我们构建图书馆。例如,通过引入长短期记忆(LS TM)技术,我们对文本(包括此前从未数字化的政府文件)的数字化流程得到了显著改进。最先进的人工智能工具也帮助我们完善了拥有百年历史的78转唱片的收藏。政策 海外数据 制定者们对面向消费者的人工智能的最新发展感到眼花缭乱,他们不应忘记,这项通用技术还有其他用途——其中许多用途超出了传统版权行业的商业范围——但它们仍然服务于版权的宗旨:“促进而不是阻碍知识的获取。”
传统的版权政策制定也经常将开放许可的世界排除在外或忽视。但在这个新领域,许多工具来自开源社区,大量数据来自维基百科或Flickr Commons等开放许可来源。声称代表作者声音的行业组织通常并不代表这些创作者,他们提出的解决方案——通常要求向企业出版商或集体权利管理组织支付费用——往往不利于开放世界的理念,并且与开放世界的理念相悖。
此外,即使除了公开授权的资料之外,开放网络上还有大量技术上受版权保护但未进行主动权利管理的内容;这些内容也用于训练人工智能模型。数百万甚至数十亿个人为这些数据源做出了贡献,而且由于他们中没有人需要注册其作品才能获得版权,因此在继续开发之前试图识别所有相关的版权所有者似乎是不可能的,也是不明智的——更不用说与他们一一协商了。认识到这些问题以及其他各种担忧,欧盟已经将版权例外编入法典,允许使用受版权保护的资料作为生成式人工智能模型的训练数据,但在商业情况下可以选择退出,并可能承担新的透明度义务。
诚然,人们对生成性人工智能可能如何影响创意工作者并造成其他危害的担忧是合理的。但版权政策制定者必须认识到,人工智能技术具有巨大潜力,能够推动科学和实用艺术的进步。根据美国版权法,允许机器人阅读既合理又合法。让我们确保利特曼教授所描述的过程不会妨碍构建人人可用的人工智能工具。