OpenAI最新AI模型GPT-4o：披着羊皮的狼？

OpenAI近日发布了一份关于其最新AI模型GPT-4o的安全评估报告，称该模型的整体风险级别为“中等”。这看似一份坦诚的自我审视报告，实则暗藏玄机。

GPT-4o自今年5月发布以来，备受瞩目。OpenAI声称在发布前，曾邀请外部安全专家对模型进行“红队攻击”（在网络实战攻防演习中，‌红队成员针对目标系统、‌人员、‌软件、‌硬件和设备同时执行的多角度、‌混合、‌对抗性的模拟攻击），以发现潜在风险。结果显示，尽管GPT-4o能够生成虚假信息、暴力内容等，但整体风险被评估为“低”。

然而，在风险评估的四个类别中，“劝说”这一类别风险较高，GPT-4o生成的文本在某些情况下甚至比人类撰写的更能影响读者意见，即使它整体上并不具有更可靠的说服力。

值得注意的是，这份报告的发布时机颇为敏感。OpenAI正面临着前所未有的安全质疑，从内部员工到政界人士批评声不断。就在GPT-4o安全报告发布前，美国麻省参议员伊丽莎白·沃伦和众议员洛丽·特拉汉联名共同签署了公开信，要求OpenAI公开回应安全审查和举报机制的相关问题。此前，OpenAI内部也曾因安全问题引起董事会担忧，CEO山姆·阿尔特曼甚至一度被解职。

更令人担忧的是，GPT-4o的发布恰逢美国总统选举前夕。这种情况下，该模型极有可能被滥用于传播虚假信息，甚至被恶意行为者利用。虽然OpenAI强调了其对安全性的重视，但这份报告却让人不禁质疑，所谓的“安全评估”是否只是为了平息舆论的烟雾弹？

对此，加州州参议员斯科特·维纳正在推动一项旨在监管大语言模型的法案，其中包括要求公司对AI的潜在危害承担法律责任。如果该法案通过，OpenAI等公司将面临更严格的安全监管。

OpenAI的“透明度”一直备受诟病。不仅训练数据来源不明，连同安全测试细节也缺乏公开。GPT-4o的安全评估报告虽然是已经朝着“透明”迈开一步，但依旧远远不够——公众有权知道这些强大AI的真实面目，以及它们可能带来的潜在风险。

OpenAI声称的“中等风险”，能否经得起时间的考验，还有待观察。