越来越多的人开始向 Claude 和 ChatGPT 等公司寻求个人帮助,但关于它们对心理健康的价值,只有传闻没有证据,直到现在。达特茅斯学院的研究人员进行了首次此类试验,利用学院开发的生成式人工智能聊天机器人来量化这种新技术模型对精神健康问题患者的有效性。
盖泽尔医学院教授 Michael Heinz(左)和 Nicholas Jacobson 领导了一项虚拟治疗师 Therabot 的试验。(图片由 Katie Lenhart 提供)
在这项研究中,美国各地 106 名被诊断患有重度抑郁症 (MDD)、广泛性焦虑症 (GAD) 或饮食失调症的参与者参加了为期四周的随机临床试验。对照组从第四周到第八周可以使用名为 Therabot 的智能手机聊天机器人。
与 ChatGPT 等聊天机器人不同,Therabot 会主动与参与者互动,提示他们回答有关情绪和情感的问题。这鼓励用户做出回应,然后进一步与他们交谈。在试验结束时,Therabot 用户(其中约四分之三当时没有其他心理健康干预)根据症状缓解措施进行评估。
患有抑郁症的参与者报告称,他们的症状平均减轻了 51%,情绪和整体幸福感都有了明显改善。与此同时,GAD 患者群体报告称,他们的症状平均减轻了 31%,许多人的临床焦虑水平从中度降至轻度,或从轻度降至诊断阈值以下。而对于患有饮食失调症的参与者来说,他们的身体形象平均改善了 19%——考虑到通过传统方法治疗这种疾病的困难,这一结果尤其令人印象深刻。
“我们观察到的症状改善与传统门诊治疗的改善相当,这表明这种人工智能辅助方法可能提供具有临床意义的益处,”达特茅斯盖泽尔医学院副教授、资深作者尼古拉斯·雅各布森 (Nicholas Jacobson) 表示。“面对面的护理无可替代,但没有足够的提供者可供使用。”
由于缺乏负担得起且及时的治疗,许多人由于各种原因得不到任何心理健康帮助。研究人员补充说,仅在美国,需求就远远超过供应,大约 1600 名需要支持的临床焦虑或抑郁症患者需要一名治疗师。虽然聊天机器人尚未接受此类工作的培训(目前),但它们为人们提供了方便且全天候的访问,以便在需要时联系他们——这种实时可靠性为那些求助于该技术的人建立了信任。
“我们希望看到生成式人工智能能够为大量无法接受面对面护理的人提供心理健康支持,”雅各布森补充道。“我看到了人际治疗和基于软件的治疗相结合的潜力。”
如果你曾经使用过聊天机器人来获得心理健康支持,你可能会发现它在那一刻很有帮助。虽然这项技术正在快速进步,但医疗专业人士仍需谨慎,不要过分依赖它的建议和反馈。
“虽然这些结果非常有希望,但没有一个生成式人工智能代理能够在心理健康领域完全自主运行,因为它可能会遇到各种各样的高风险情况,”第一作者、达特茅斯希区柯克医学中心助理教授兼精神病学家迈克尔·海因茨说。“我们仍然需要更好地理解和量化在心理健康环境中使用生成式人工智能所带来的风险。”
与其他现有聊天机器人不同,Therabot 是在咨询心理学家和精神病学家后开发的,专门用于心理健康支持工具。因此,用户将收到对提示的开放式回复,鼓励他们进一步谈论他们的担忧和情绪状态。在试验期间,设置了护栏以识别任何有自残风险的参与者,并提供可点击的紧急护理链接。
在试验的最初四周后,用户(以及对照组)又有四周的时间可以使用 Therabot,但这次没有应用程序的自愿提示。参与者继续与聊天机器人互动。
人们在整个试验过程中花了大约六个小时与 Therabot 交流,这相当于与治疗师进行大约八次治疗。在症状最明显的时候,例如深夜,使用率有所上升。在试验的早期阶段之后,人们继续使用,这表明用户已经与该工具建立了某种联系,并对其产生了信任。
“我们没想到人们竟然会把这个软件当朋友一样对待,”雅各布森说,“这说明他们实际上正在与 Therabot 建立关系。”
“我的感觉是,人们也乐于与机器人交谈,因为它不会评判他们,”他补充道。
参与者报告称,他们更愿意坦诚地接受 Therabot,但研究并未评估这种益处本身如何有助于缓解症状。尽管研究人员很快警告过度依赖这项技术存在未经研究的风险,但研究表明,这既有需求也有好处。
“我们的结果与那些接受门诊黄金标准认知疗法的人所获得的结果相当,”雅各布森说。“我们谈论的是,在较短的时间内为人们提供相当于在护理系统中可以获得的最佳治疗。
“自 ChatGPT 发布以来,许多人都涌入这个领域,很容易提出一个乍一看很棒但安全性和有效性尚未得到充分证实的概念证明,”他补充道。“这是需要认真监督的案例之一,提供这种监督确实让我们在这个领域脱颖而出。”
该研究发表在《新英格兰医学杂志》上:NEJM AI