这几天,被 OpenAI 藏了几个月的大招终于被放了出来,那就是 “Code interpreter” ,代码解释器。差友们一看这个名字,可能会觉得有点嗤之以鼻,不就是一个帮助写代码的东西嘛,类似的插件都到处都是了,你现在出来有啥用啊?
欸!虽然它的名字是叫代码解释器,但它做的事情可不是帮你写代码。
简单来说,它相当于你和 AI 的翻译器,能把你的需求通过自然语言,翻译成可通过程序解决的具体方案。而且还给你提供了一个 100MB 大小的可上传文件空间,用来上传你需要处理的文件。
在几个月前, Code interpreter 就开放给部分的开发者试用了,其中就有博主在试用了一段时间后,发现使用了 Code interpreter 后, ChatGPT 有了质的飞升,比如现在的 ChatGPT 可以去解决非常复杂的数学问题,胡言乱语的发生率也降低了,并且更加擅长于解决实际的应用等等。
所以世超也很迫不及待的,马上登上了快一个月没上的 OpenAI 官网,看看这个代码解释器到底有多厉害。
试用代码解释器的第一步,咱们先得在 “ 设置 ” —— “Beta features” 中,打开 Code interpreter 。
然后在 GPT-4 的选择框下,选用 Code Interpreter ,这样就能顺利试用上了。
世超平时也会剪辑视频,所以在用上这个功能的第一时刻,就是让它给我剪一段视频。
世超先是上传了一段 115 秒的视频,然后告诉 ChatGPT ,帮我把中间的十秒钟剪出来。
结果 ChatGPT 先是怼了我一句,说我的描述不清楚,需要提供更多信息。
好吧,这确实错在于我,于是我告诉它是正中间的十秒。
这下就清楚了,在经过一顿哐哐哐的代码加工过程后, ChatGPT 输出了一个 “overwatching _ subclip.mp4” 的文件。
下载下来后,确实是截取的原视频 50-60s 处的片段,而且刚刚好 10s 。
接下来,我又上传了一个仓库存储的表格,让它把余库存大于 50 的物品列出来,整合成新的表格,然后做成带有动画的柱状图 GIF 。
可是代码是给出来了,问题也是理解了,它却让我们自己去运行这个代码。
还说自己的运行环境不支持直接生成 GIF 动画。
但是我用你不就是因为不想去写代码嘛?你让我自己去运行是闹哪样?
于是世超给了 ChatGPT 一点点小小的鼓励,告诉它可以生成 GIF ,勇敢的去尝试一下。
没想到,它居然真的有了回应,直接给咱生成了一个 GIF 文件,还给了一个下载链接,这说明鼓励教育还是很有用的。
只是嘛,生成的 GIF 数据图可能是因为动画描述不太清楚,一直在那乱动,而且中文部分的文字编码也是乱码,但总体上来说,任务完成得还是挺好,剩下的也就是一些细节方面了。
随后,我又让 ChatGPT 分析一下库存数量 50 以上的物体都有什么特点,再做一个饼状图表示。
这次 ChatGPT 先是把表单列了一遍,然后画了一个饼状图,分析说是 “DBTW 杜邦纸袋 ” 占了最大部分。
世超又继续提问,这些物品都有什么特点, ChatGPT 也是根据数据很好的总结下来了。
不得不说,在试用到这里的时候,世超已经是有点折服了,之前能直接帮我剪片子的时候,世超都感觉有点吃惊,而这次的报表统计,则是实实在在的提升了工作效率。
在后续,世超又试了试代码解释器的其它功能,我先是问了问它,能不能帮我想想用代码展示一些看起来不可能但实际上并非如此的东西。
这次 ChatGPT 给出了一个绘出 3D 立方体的代码,在运行后,生成了一个投影在 2D 平面上的 3D 立方体。
而且 ChatGPT 还告诉世超,这是计算机图形学中的一个基本概念,这个概念被广泛的运用在各种应用中,包括游戏,电影和虚拟现实。
后面我还尝试了许多其它的问题,比如画一个分形图案。
还有绘制函数,并且画出数据集的散点图。
可以说,有了这个代码解释器,未来工作上的很多事情,基本上就是说说话就好了。
在我看来,这次 ChatGPT 放出的代码解释器,很像前段时间大火过的开源项目 AutoGPT 。
但相较之下,代码解释器除了不能联网,能力上可比 AutoGPT 强的多了,不仅自己能理解咱们的需求,寻找解决办法解决,还能自动帮咱们画出需要的数据图表。
可谓是真正的实现了大语言模型的多模态了。
最后,世超还问了 ChatGPT 一个至今还没被证明数学难题——黎曼猜想。
可惜的是,不管世超如何鼓励它,这次, ChatGPT 是说什么也不回答咯……
看来想要让 AI 解一些人类都无法解决的问题,目前还是不太行。
但按照目前 AI 发展的速度,谁也说不准。
或许就在迭代个 925 次之后,即便是宇宙的终极问题, AI 也能在几秒钟后给出答案吧。