据英国《卫报》报道,此次参与发表声明的行业协会包括出版商协会(Publishers Association),作家协会(The Society of Authors),作者许可与收藏协会(The Authors’ Licensing and Collecting Society)和作家代理人协会(The Association of Authors’ Agents)。这也是人工智能工具侵入出版业后,行业机构的第一份作为“反击”的联合声明。


声明发表在英国政府人工智能安全峰会的前一天。英国的出版机构盛赞了此类峰会,并表示英国有潜力成为全球人工智能相关行动的有力推动者。声明中写道:“我们需要承认人工智能工具已经产生的版权侵权行为,并给予受损者赔偿。同时,应保证此类行为不再发生”。


自ChatGPT等大型语言模型在今年年初吸引关注以来,作家对其侵犯版权的控告已经上演多轮。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家针对Meta公司旗下的大型语言模型LLaMA提起诉讼。同月,包括玛格丽特·阿特伍德、乔纳森·弗兰岑 (Jonathan Franzen)、阮清越(Viet Thanh Nguyen)等在内的多位知名作家在美国作家协会(Authors Guild)组织下也签署了一封联名信,呼吁微软、Meta(互联网公司)等公司停止他们在未经同意的情况下,使用作家们的作品用于训练OpenA等语言模型。除此之外,今年9月,亚马逊为旗下Kindle图书内容制定新规,要求自行出版商(Self-publishers)在使用人工智能生成内容时对读者作出告知。


使用大型语言模型的公司也对此作出过回应。据介绍,Meta利用一个叫Books3的AI工具数据集训练LLaMa。这个数据集还收纳了包括扎迪·史密斯、史蒂芬·金等知名作家的作品。8月,《大西洋月刊》也刊文指出,彭博社也将该数据集用于训练旗下语言模型BloombergGPT。不过,本月初,彭博社的发言人表示,该公司并未使用Books3训练BloombergGPT的商用版本。而在9月,Meta对诉讼的回应是他们使用受版权保护的文本来训练LLaMa是一种“合理使用”。最初创见Books3的人工智能开发人员肖恩·普雷瑟(Shawn Presser)曾在采访中表示,他创建该数据集的目的恰恰是为了让任何人都可以开发和训练生成式人工智能,从而避免大公司的技术垄断。


此次签署声明的行业协会表示,“人类创造力是出版业和更广泛的创意产业的基石”,而创意产业需要在“强有力的版权制度、补偿、创作者的信誉保障下”才能蓬勃发展。他们认为,如果想尽早结束人工智能工具的“不透明发展”,除了需要出版业的团结一致,更需要政府的大力介入,他们呼吁在人工智能面前“确保作者在作品被使用时获得许可和相应的报酬”。


参考链接:

1. Publishing associations urge UK government to protect copyrighted works from AI

https://www.theguardian.com/books/2023/oct/31/publishing-associations-urge-uk-government-to-protect-copyrighted-works-from-ai

2.Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI

https://www.theguardian.com/books/2023/aug/22/zadie-smith-stephen-king-and-rachel-cusks-pirated-works-used-to-train-ai

3.Self-publishers must declare if content sold on Amazon’s site is AI-generated

https://www.theguardian.com/books/2023/sep/11/self-publishers-must-declare-if-content-sold-on-amazons-site-is-ai-generated


作者/刘亚光

编辑/走走

校对/卢茜