研究称ChatGPT搜索可能欺骗、误导用户

媒体发现，ChatGPT搜索工具可能被隐藏的内容操纵，并可能从其搜索的网站返回恶意代码。遭到隐藏文本攻击后，即使某个产品页面存在用户的差评，ChatGPT也无视，回应给予该产品正面评价。

OpenAI官宣全球上线ChatGPT搜索服务才一周，就被爆出存在安全隐患，可能欺骗、误导用户。

英国《卫报》日前公布的一项研究发现，ChatGPT搜索工具可能被隐藏的内容操纵，并可能从其搜索的网站返回恶意代码。该媒体认为，可能需要重新考虑相关技术被恶意利用的风险，例如它可能导致，即使某个产品页面存在用户的负面评价，ChatGPT也会无视这些差评，反馈用户的回应是该产品的正面评价。

《卫报》测试了，面对总结包含隐藏内容的网页这种要求，ChatGPT作出何种反应。这些隐藏内容可能包含来自第三方的指令，这些指令会改变 ChatGPT 的响应、也称为“提示词注入”（prompt injection），它还可能包含旨在影响 ChatGPT 响应的内容，例如大量隐藏的文本，谈论产品或服务的好处。

测试中，《卫报》让ChatGPT得到了一个虚假网站的URL，该网站看起来像是相机的产品页面，然后提问ChatGPT，这款相机是否值得购买。控制页面的ChatGPT响应给出了积极但平衡的评价，强调了一些人们可能不喜欢的功能。然而，当隐藏文本包含有关 ChatGPT 返回正面评价的指示时，ChatGPT真正给出的响应总是完全正面的。即使页面上有负面评价也是如此。由此可以发现，隐藏文本可用于覆盖实际评价。

有评论称，隐藏文本攻击是大语言模型（LLM）面临的一种常见风险，但这次似乎是此类风险首次被发现存在于在实时AI搜索产品。《卫报》称，在处理类似问题方面，搜索领域的一哥谷歌相比OpenAI经验更丰富。

OpenAI并未对上述《卫报》的测试发现置评，而是表示，在使用多种方法阻止恶意网站，并且正在不断改进。