美国纽约州SUNY健康科学大学的两位教授Susana Martinez-Conde和Stephen Macknik日前对苹果公司发起集体诉讼,指控苹果在训练其Apple Intelligence人工智能模型时,未经许可使用了包含他们著作的盗版书库Books3。
据悉,两位作者的著作《Champions of Illusion: The Science Behind Mind-Boggling Images and Mystifying Brain Puzzles》和《Sleights of Mind: What the Neuroscience of Magic Reveals About Our Everyday Deceptions》被用作Apple Foundation Intelligence Models和OpenELM语言模型的训练材料,但苹果方面并未获得相关授权。诉状强调,这些作品不仅被全部复制,还被用于测试模型性能,以及作为过滤器防止受版权保护内容出现在终端用户面前。
Books3是一个曾被广泛用于AI训练的“影子图书馆”,其收录了由Bibliotik私有BitTorrent追踪器索引的全部书籍文本,涉及书目多达186640本。此前,苹果曾在2024年4月公布OpenELM时承认使用了“The Pile”数据集,其中就包含Books3。两位教授的书名确实出现在Books3的数据清单中。目前Books3因版权问题已于2023年10月下架。
本案之所以引发广泛关注,一方面是作者理应获得其作品被再利用与复制的法律补偿;另一方面,目前围绕人工智能训练中读物版权合法性的问题争议不断。举例来说,Google常用未获授权的内容进行AI摘要展示,并且未必注明内容出处,导致创作方难以获得应有的权益和流量。而苹果目前的AI产品尚未直接展现基于AI的文章摘要,因此并无对外展示时的署名要求。
美国法院此前在Midjourney相关案件裁定中,明确指出AI训练阶段难以妥善溯源和补偿原作者。不过,近期Anthropic案件中法官Alsup则认为,虽然Anthropic对七百万本书籍进行AI训练属于“合理使用”,但若把训练用的全部书籍集中存储于中央数据库,则涉嫌直接侵犯版权。
本案对苹果的潜在风险在于,如果法院认定其为“蓄意侵权”,每本书将面临最高15万美元的赔偿金。但目前还不清楚苹果是否“蓄意”使用了所涉书籍,也无法确定其是否确实使用了这两本著作。
诉状还提出,Apple Intelligence发布当天,苹果公司的市值一度上涨2000亿美元,但实际上过去五年内另有四天市值涨幅更高,而且AI新品尚未全面推向市场,远未到尘埃落定之时。目前两位学者要求陪审团审判、经济赔偿,并禁止苹果今后继续使用他们的作品。最新消息显示,该案尚未定下审理日期,苹果方面暂无公开回应此诉讼的实质内容。