强化学习先驱严厉批评人工智能开发的"不安全"状态
理查德-萨顿(Richard Sutton)和安德鲁-巴托(Andrew Barto)是强化学习(一种现代人工智能模型所使用的机器学习技术)的先驱。 萨顿经常被称为"强化学习之父",是阿尔伯塔大学的教授。 巴托是马萨诸塞大学的名誉教授。 这两位科学家对人工智能公司如何应用他们毕生的研究成果并不特别满意。
理查德-萨顿(Richard Sutton)和安德鲁-巴托(Andrew Barto)因其对机器学习发展的重大贡献而获得了今年的图灵奖(被誉为计算机领域的诺贝尔奖)。 这两位研究人员现在公开反对 OpenAI、Google和其他人工智能公司向终端客户发布具有潜在危险的软件。 他们批评 ChatGPT 只是一台赚钱机器,永远不会产生有效的人工通用智能(AGI)。
萨顿和巴托受行为主义心理学的启发,于 20 世纪 80 年代开发了强化学习(RL)。 强化学习与监督学习和无监督学习并称为三大基本机器学习范式。 强化学习教人工智能代理通过尝试和犯错,做出能实现最优结果的决策,这与人类的学习方式类似。
OpenAI、Google和其他公司都利用 RL 建立了自己的人工智能平台。 金融时报》指出,巴托认为,在没有保障措施的情况下向数百万人提供这种人工智能软件本质上是错误的。 萨顿和巴托用一个比喻指出,大多数或所有的人工智能公司都在建造一座桥梁,并通过向公众开放来测试其结构的完整性。
巴托说,合理的工程实践建议开发人员尽量减轻技术带来的负面影响。 无论是 OpenAI 还是其他任何专注于人工智能的公司都没有这样做。 当前的人工智能模型会出错,以二进制的信心幻化出不存在的"事实",但其背后的公司却在史无前例的融资活动中募集了数十亿美元。"拥有庞大的数据中心,然后收取一定的软件使用费,这样的想法是有动机的,但这不是我所认同的动机。"
营利性公司只寻求赚钱的机会。 它们中的任何一家最终将第一个(AGI)带到世界上,也不过是吹嘘而已;即使是这样,也是为了提高销售额。
AGI 的支持者认为,这种超人的全数字智能即将到来,并将彻底革新技术和其他一切。 萨顿认为,AGI 只是营销活动中的一个流行词。 巴托说,开发人工智能的公司需要更好地了解人类大脑是如何工作的,然后才能负责任地构建具有人类智能水平的系统。