苹果公司在Apple Intelligence上的巨大赌注已经面临数据采集的挫折
全球用户现在都可以使用Apple Intelligence,并计划在今年晚些时候进行更广泛的推广。人工智能工具包也有望成为即将推出的 iPhone 16 系列的卖点。然而,由于各大网站和社交平台阻止苹果的人工智能机器人搜刮数据,苹果想通过 Apple Intelligence 大展拳脚的努力已经步履维艰。
据《连线》报道,前不久,苹果公司向出版商透露了一个工具,让他们选择退出公司的人工智能训练计划。这意味着苹果的人工智能机器人不能再为训练目的而采集数据。影响是深远的,一些最大的新闻网站和社交平台都选择退出苹果 AI 计划,从而影响了苹果 AI 的发展格局。
报道称,Facebook、Instagram、Craigslist、Tumblr、《纽约时报》、《金融时报》、《大西洋月刊》、Vox Media、《今日美国》网络以及《WIRED》的母公司康泰纳仕等网站似乎都选择退出Apple Intelligence训练。
像ChatGPT 这样的人工智能聊天机器人在很大程度上依赖于互联网上发布的有价值的内容来丰富自己的知识库,并为用户提供正确的答案。然而,作为这种模式的支柱,出版商往往对这种安排并不满意,因为人工智能聊天机器人会免费使用这些内容。虽然聊天机器人开发者试图通过在每条提示语末尾添加源链接来缓解这一问题,但出版商仍理所当然地要求为其内容获得补偿。
自 2015 年以来,苹果公司一直在使用一种名为"Applebot"的工具抓取互联网信息,并为 Siri 和 Spotlight 等产品提供素材。不过,"Applebot"现在被用来训练"Apple Intelligence"(。如果出版商屏蔽了 Applebot,他们的内容将不会被用于训练苹果的大型语言模型,但这些内容仍将用于 Siri 和 Spotlight 搜索。
金钱可能是这些出版商选择退出Apple Intelligence培训的主要原因。如果苹果公司真的尊重出版商的选择,它就需要与出版商签订商业协议,使用他们的数据,或者寻找其他来源为其大型语言模型提供数据。