Google的政策更新:你发布的所有内容都将被用于AI训练
如果你对你在网上公开发布的内容将被送入人工智能模型有任何疑问,请看一下Google更新的隐私政策。该文件现在明确指出,该公司保留收集和分析人们在网上分享的几乎所有内容的权利,以训练其AI系统。
Google上周末的更新为其隐私政策引入了新的措辞。它以前说过,人们的数据将被用于训练"语言"模型,只提到了Google翻译。更新后的版本将其改为"人工智能模型",特别提到了与翻译一起的巴德和云人工智能。
ChatGPT和Bard等生成性人工智能系统的许多有争议的问题之一是它们收集和使用数据的方式。虽然它可能是公开的信息,但这并不能阻止抄袭和隐私问题,更不用说人工智能有可能曲解所说的内容或提供过时的旧答案。甚至Google也警告员工,在使用像它自己的Bard这样的聊天机器人时要谨慎,因为它们可能会提出不受欢迎的代码建议。
还有一个问题是,这种数据采集是否合法。ChatGPT的创造者OpenAI正面临诉讼,因为它被指控非法收集互联网用户的个人信息,并使用这些数据来创造其产品。
OpenAI还在处理关于侵犯版权和侵犯隐私的诉讼,该诉讼声称它未经许可使用有版权的书籍来训练其人工智能系统。据称,该公司从这些书籍中非法复制文本,没有获得版权所有者的同意,也没有给予他们补偿。
对于埃隆-马斯克来说,数据采集似乎是一个特别令人困扰的话题。上周末,Twitter暂时限制了账户每天可以阅读的推文数量,据称是为了解决平台上"极端水平"的数据采集和"系统操纵"--尽管并非所有人都认同这是施加限制的原因。
自从关闭对其API的免费访问以阻止数据采集以来,Reddit也面临着一连串的麻烦。此举导致超过8000个子版块关闭以示抗议。