OpenAI 发布首份关于使用 ChatGPT 如何影响人们情绪健康的研究
每周有超过 4 亿人使用 OpenAI 的 ChatGPT。但与它的互动会对我们产生什么影响?它会让我们更孤独还是更不孤独?这些是 OpenAI 与麻省理工学院媒体实验室合作开展的两项新研究中要讨论的一些问题。
他们发现,只有一小部分用户对 ChatGPT 产生了情感共鸣。伦敦国王学院人工智能与社会学教授凯特·德夫林 (Kate Devlin) 表示,这并不奇怪,因为 ChatGPT 并没有像 Replika 或 Character.AI 那样被宣传为一款人工智能伴侣应用,她没有参与该项目。
“ChatGPT 被设定为一种生产力工具,但我们知道人们无论如何都会把它当作一款伴侣应用来使用。事实上,以这种方式使用它的人可能会长时间与它互动,有些人平均每天使用半小时左右。 作者们非常清楚这些研究的局限性,但看到他们做到了这一点还是很令人兴奋的,”德夫林说。“能够获得这种级别的数据真是太不可思议了。”
研究人员发现,男性和女性在使用 ChatGPT 时的反应存在一些有趣的差异。在使用聊天机器人四周后,女性研究参与者与人交往的可能性略低于男性参与者。与此同时,在实验结束时,以非自己性别与 ChatGPT 语音模式互动的参与者报告称,他们的孤独感明显更高,对聊天机器人的情感依赖性更强。OpenAI 计划将这两项研究提交给同行评审期刊。
由大型语言模型驱动的聊天机器人仍是一项新兴技术,很难研究它们如何影响我们的情感。该领域的许多现有研究(包括 OpenAI 和麻省理工学院的一些新研究)都依赖于自我报告的数据,而这些数据可能并不总是准确或可靠的。
话虽如此,这项最新研究确实与科学家迄今为止发现的聊天机器人对话在情感上有多吸引人相呼应。例如,2023 年,麻省理工学院媒体实验室的研究人员发现,聊天机器人倾向于反映用户消息的情感情绪,这表明存在一种反馈循环,你表现得越快乐,人工智能看起来就越快乐,或者另一方面,如果你表现得更悲伤,人工智能也会如此。
OpenAI 和麻省理工学院媒体实验室采用了双管齐下的方法。首先,他们收集并分析了近 4000 万次与 ChatGPT 互动的真实数据。然后,他们询问了 4076 名有过这些互动的用户,他们感觉如何。接下来,媒体实验室招募了近 1000 人参加为期四周的试验。这次试验更加深入,研究参与者每天至少与 ChatGPT 互动五分钟的情况。实验结束时,参与者完成了一份问卷,以衡量他们对聊天机器人的看法、他们的主观孤独感、他们的社交参与度、他们对机器人的情感依赖,以及他们对使用机器人是否有问题的感觉。他们发现,与 ChatGPT 更信任和“亲密”的参与者比其他人更容易感到孤独,也更容易依赖它。
参与该项目的 OpenAI 安全研究员 Jason Phang 表示,这项工作是深入了解 ChatGPT 对我们的影响的重要第一步,这可以帮助人工智能平台实现更安全、更健康的互动。他说:“我们在这里做的很多工作都是初步的,但我们正尝试与该领域展开对话,讨论我们可以开始衡量的事情,并开始思考对用户的长期影响。”
德夫林表示,尽管这项研究值得欢迎,但仍然很难确定人类何时在情感层面上与科技互动。她说,研究参与者可能正在经历研究人员没有记录下来的情绪。“就团队的衡量标准而言,人们可能不一定会以情感的方式使用 ChatGPT,但你不能将人性与你与技术的互动分开,我们使用我们创建的这些情感分类器来寻找某些东西——但这对某人的生活究竟意味着什么,真的很难推断。”