时间:2025-02-15 09:05:12来源:界面新闻
尼尔·盖曼1960年生于英国,是当代知名幻想文学作家,曾多次获得雨果奖、星云奖,多部作品遭搬上荧幕和舞台。自去年的指控发生以来,盖曼的三部影视改编作品都已遭抵制、取消或暂停制作,包括Netflix的《死亡男孩侦探社》、亚马逊的《好兆头》第三季以及迪士尼仍在开发阶段的《坟场之书》。
最新法庭档案显示,Meta使用盗版书数据库训练人工智能据《连线》(Wired)报道,日前加州地方法院披露的一份法庭档案显示,Meta遭一群作者指控侵权,原因是Meta使用名为LibGen的知名盗版书数据库训练人工智能语言模型。
该案件发生于2023年7月,并于近日得到公开,作为最早针对科技公司人工智能训练引起的版权诉讼之一,这起名为“卡德雷等人诉Meta平台案”(Kadrey et al. v. Meta Platforms)的案件引起了广泛关注,人们认为,它的结果将决定科技公司是否可以合法使用创意作品训练人工智能。
在这些档案公开前,Meta曾在一篇论文中透露,它已经从互联网抓取大约196,000本图书的数据集,却并没有公开数据来源。此次公开的档案引用Meta员工的内部言论,指出这些数据来自包括LibGen在内的盗版数据库,记录还显示,Meta的CEO扎克伯格对此知情。
面对控告,融易新媒体消息,Meta回应称,使用LibGen这样“公开可用”的材料来训练人工智能工具受到“合理使用”(fair use)原则的保护,该原则认为,在某些情况下,未经许可使用受版权保护的作品是合法的,例如“使用文本进行语言的统计建模并生成原创表达”。
法官最初同意了Meta的反驳意见,认为原告未能提供足够证据证明Meta删除了所谓的“版权管理信息”,例如作者姓名和作品标题。但作者们提供了新的指控理由,他们引用一位公司代表的言论,指出Meta曾上传包含原告作品在内的盗版文件至盗版网站,这意味着,Meta不仅在未经许可的情况下使用了受版权保护的材料,还将其进一步传播。
该案件反映了Meta近年来陷入的困境,去年《纽约时报》曾报道指出,Meta已经用完了几乎所有能在网上找到的英文图书资源,并渴望获得更多数据。不只有Meta面临这一状况,包括OpenAI在内的多个前沿实验室都遇到了数据墙,并在不断讨论各种奇怪的新方法来获取新数据,Meta此次的争议事件就是一个例子。
第172届芥川奖和直木奖公布