X 正在测试让 AI 聊天机器人生成社区笔记的计划

摘要:

社交平台X将试行一项允许 AI 聊天机器人生成社区笔记的功能。社区笔记是 Twitter 时代的一项功能,埃隆·马斯克在他掌管这项服务(现名为 X)期间对其进行了扩展。参与这项事实核查程序的用户可以发表评论,为某些帖子添加背景信息,这些评论随后会由其他用户进行核实,之后才会附加到帖子中。

例如,社区笔记可能会出现在一篇人工智能生成的视频帖子中,如果该视频的合成来源不明确,或者作为政客误导性帖子的附录。

当过去对评级存在分歧的群体达成共识时,评级就会公开。

Community Notes 在 X 上取得了足够的成功,从而激励了Meta、TikTok和YouTube采取类似的举措——Meta彻底取消了其第三方事实核查程序,以换取这种低成本的社区劳动力。

但使用人工智能聊天机器人作为事实核查器是否有利或有害还有待观察。

这些 AI 笔记可以使用 X 的 Grok 生成,也可以使用其他 AI 工具并通过 API 连接到 X。AI 提交的任何笔记都将与人类提交的笔记同等对待,这意味着它将经过相同的审核流程以确保准确性。

考虑到人工智能经常产生幻觉或编造不基于现实的内容,使用人工智能进行事实核查似乎是值得怀疑的。


图片来源:X 社区笔记的研究

根据X Community Notes研究人员本周发表的一篇论文,建议人类与大语言模型(LLM)协同工作。人类反馈可以通过强化学习增强AI笔记生成,而人类笔记评分员则在笔记发布前进行最终检查。

论文指出:“我们的目标并非创造一个告诉用户该思考什么的人工智能助手,而是构建一个生态系统,让人类能够更具批判性地思考,更好地理解世界。LLM和人类可以形成良性循环。”

即使有人工审核,过度依赖人工智能仍然存在风险,尤其是在用户能够嵌入第三方大语言模型(LLM)的情况下。例如,OpenAI 的 ChatGPT 最近就遇到了一个模型过于谄媚的问题。如果大语言模型(LLM)优先考虑“有用性”而不是准确地完成事实核查,那么人工智能生成的评论最终可能会完全不准确。

人们还担心,人类评分者会因人工智能生成的评论数量过多而负担过重,从而降低他们充分完成这项志愿工作的积极性。

X 计划先测试这些 AI 贡献几周,如果成功的话,再更广泛地推出它们。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan