今年9月,一些使用Google Search Console的开发者发现了异常现象——在网站的搜索流量报告中,出现了类似聊天内容的文本,而非以往那种简短的搜索词。这些新条目看起来更像是用户与聊天机器人之间的私密对话,涉及个人或工作相关的问题,而不是网站常见的搜索访客请求。

Google Search Console原本用于展示用户通过Google搜索访问网站的方式。让网站管理员感到震惊的是,这些新出现的内容与搜索词毫无相似之处,更像是与聊天机器人的私人对话,被记录进了本应只包含流量分析数据的系统。
这一异常最早由分析公司Quantable创始人Jason Packer在公司博客上发布调查报告。他与网站优化顾问Slobodan Manić合作,花费数周时间复现实验、测试不同输入、追踪ChatGPT搜索功能与Google索引系统的交互。最终调查结果揭示了远超“单纯故障”的隐私风险。
据Packer和Manić的测试,部分ChatGPT会话会将用户提示词无意中路由到Google搜索。他们追溯到一个特定的URL模式——https://openai.com/index/chatgpt/——这个地址反复出现在泄露内容的开头。当Google对该地址进行分词时,会解析为“openai”,“index”,“chatgpt”,而针对这些词排名靠前的网站,其Search Console后台就能看到部分ChatGPT用户提示被记录。
换言之,如果ChatGPT提交的用户提示触发了外部搜索,Google有时会把提示本身作为搜索词来记录。对于受影响站点的管理者来说,被泄露的提示词就会作为流量数据出现在后台。
OpenAI承认这个问题,称其为“一次短暂影响少量搜索的路由故障”,并表示已修复但未详细说明。Packer欢迎OpenAI快速修复,但指出公司并未正面回应更大的问题——此次事件是否坐实了ChatGPT持续抓取Google搜索结果以增强应答。
这一问题涉及ChatGPT在新版GPT-5模型中引入的“网页浏览”行为——当系统判断某个提示需要最新或外部信息时,会触发网页搜索。但Packer和Manić发现,有一版聊天界面内有个“hints=search”的参数,使其几乎每次都会触发搜索。
同时,一个输入框的错误导致引用网址被附加到每个查询。这样,ChatGPT每次执行搜索时,Google不仅记录了网址,还会记录用户的提示。由于Search Console会追踪完整搜索字符串,这就使得用户提示对相关站点所有者“全盘可见”。

Packer认为系统与Google的索引基础设施发生了直接交互,而非通过私有API或内部数据通道(否则不会显示在Search Console中)。这种意外的可见性实际上表明,ChatGPT在执行现场Google搜索,并把用户输入暴露给了Google及所有相关的站点。
OpenAI表示,仅有极少数搜索请求泄露,并未给出具体数值,因此暂不清楚其7亿每周活跃用户中有多少人受影响。
此前,曾发生过用户发现自己与ChatGPT的公开链接被Google主站收录的问题,当时OpenAI称其为用户误操作了分享开关。而本例中,Packer强调没有任何用户操作触发了泄漏。“没有任何同意机制参与,”他接受Ars Technica采访时表示。“没人点选‘分享’,提示词就这样被错误地路由走了。”与公开页面不同,Search Console中的条目无法被受影响用户手动删除,因此这些内容会一直暴露给排名相关关键词的网站所有者。
研究人员怀疑,这一异常还可能与搜索引擎分析领域称为“鳄鱼嘴”的现象有关——即Search Console图表上展现量飙升但点击量下滑。如果OpenAI系统反复用大量合成查询请求Google,极可能会扭曲这些分析数据。
Packer和Manić至今无法确认OpenAI的修复是否完全阻断了所有类型的提示词泄露,或仅仅解决了指定URL路由机制的bug。他们表示还需持续关注。“我们还不知道是不是只影响了某种界面,还是涉及更广范围的会话。”Packer说,“总之,这正提醒着我们,这些AI工具背后的系统对用户数据的处理还有很多不可控和难以预料的风险。”