Google承认刚推出的Gemini AI至少有一段性能演示是经过剪辑的
Google刚刚发布了其迄今为止最强大的人工智能模型套件"双子座"(Gemini),但该公司已被指责在性能方面撒谎。彭博社的一篇专栏文章称,Google在最近的一段视频中歪曲了"双子座"的性能。专栏作家帕米-奥尔森(Parmy Olson)说,Google在本周早些时候的发布会上播放了一段令人印象深刻的"What the AI quack"的上手视频,在视频中,Gemini 看起来能力非凡--也许能力太强了。
这段六分钟的视频展示了 Gemini 的多模态功能(例如,口语对话提示与图像识别相结合)。双子座似乎能快速识别图像(甚至是连线图片),在几秒钟内做出反应,并实时跟踪杯球游戏中的纸团。当然,人类可以做到所有这些,但这是一个能够识别并预测接下来会发生什么的人工智能。
不过,点击 YouTube 上的视频描述,Google有一个重要的免责声明:"为了演示的目的,延迟已经减少,双子座的输出已经缩短,以求简洁"。
这正是奥尔森不满意的地方。根据她在彭博社发表的文章,Google在被要求发表评论时承认,视频演示并不是通过语音提示实时进行的,而是使用了原始镜头中的静止图像帧,然后写出文字提示,让双子座做出回应。奥尔森写道:"这与Google似乎在暗示的内容大相径庭:人可以与双子座进行流畅的语音对话,同时双子座会实时观察并回应周围的世界。公平地说,Google公司经常编辑演示视频,尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是,Google在视频演示方面一直存在问题。人们曾怀疑Google的 Duplex 演示(还记得 Duplex 吗?Duplex 是一款人工智能语音助手,可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"
在这种情况下,奥尔森认为Google是在"作秀",目的是误导人们,让他们不知道 Gemini 仍然落后于 OpenAI 的 GPT。
Google对此并不认同。当被问及演示的真实性时,Google指出了Google DeepMind 研究副总裁兼深度学习负责人 Oriol Vinyals(也是 Gemini 的联合负责人)的一篇文章,其中解释了团队是如何制作视频的。
Vinyals 说:"视频中的所有用户提示和输出都是真实的,为了简洁起见进行了缩短。视频展示了使用 Gemini 构建的多模式用户体验。我们制作它是为了激励开发人员。"
他补充说,团队给双子座提供了图片和文本,并要求它预测接下来会发生什么。
这当然是处理这种情况的一种方法,但对Google来说可能并不合适--至少在公众看来,Google已经被 OpenAI 今年的巨大成功吓了一跳。如果Google想激励开发者,就不能通过精心剪辑的宣传片,这些宣传片可能会歪曲人工智能的能力。而是通过让记者和开发人员实际体验产品。让人们在小型公开测试版中用双子座做蠢事。让我们看看它到底有多强大。
热门评论
>>共有0条评论,显示0条