Sam Kronick 是一名艺术家,其在奥克兰工作室的办公桌前摆放了一列石头。他打算在这些石头上画点什么,但既不用笔也不用纸。他和他的小伙伴 Tara Shi 打算3D 扫描这些石头,然后使用人工智能软件绘制石头轮廓,让其逐步建立对石头的认识。 这个项目乍看之下很简单:尝试用人工智能软件进行自然艺术的创作。但这不失为一个衡量计算机创新能力的办法。
Sam Kronick 和 Tara Shi 采用的神经网络是基于一个类人脑的生物神经系统而打造。而这种神经网络需要用大量的数据进行建库训练,比如不同石头的形状、大量的网络图片、成千上万种不同的搜索术语。而数据库中需要什么类型的数据取决于神经网络的用途。
神经网络是以分层思考的方式进行处理,每层都会处理当前网络正在分析问题的不同方面。举个例子,如果神经网络正在学习如果识别石头,其中一层网络会生成一个算法尝试找到石头的文本描述,而另一层网络则会尝试找到不同颜色的石头种类。
这样一来现在的问题就变得棘手了。因为我们很容易测试一个脸部识别程序是否有效。然而,要让计算机识别石头却是十分复杂的。Kronick 说:
“电脑会提出一系列问题。什么是石头?石头最重要的部分是什么?为什么我们建的模型要有这么多石头?”
Sam Kronick 和 Tara Shi 之所以十分在意这个问题,是因为他们希望能通过神经网络创作的艺术作品来揭开人工神经网络的神秘面纱。为了加快产品的研发速度,或者用不太恰当的术语是使产品更智能,人工神经网络不断为大大小小的技术公司所运用。而使用人工智能进行艺术创作的艺术家远不止 Kronick 和 Shi 两位。在这一过程中,这些艺术家们加强了人们对于这项技术的理解,它开始逐渐成为人们生活中的一部分,替人们做出更好的决定,让世界变得更加美好。
AI 识图:有点像和外星人对话
实际上人们开始逐渐接受神经网络的艺术成果。
就在今年早些时候,伦敦的一个团队利用深度学习编写了一首音乐。
而谷歌也展示了其神经网络技术 DeepMind,让它生成了一些光怪陆离(魔性)的图像,大概长这样:
神经网络还被用来制作 MV。
网络上关于如何利用神经网络进行艺术创作的教程有很多,我们希望看到更多的艺术成果。
在沉睡数十年后,神经网络,亦称为深度学习终于开始广泛使用起来了。因为以前我们数据匮乏,而现在是个大数据时代,我们拥有大量的数据。神经网络能利用的数据越多,其训练成果便会更加有效。如今我们随处可见神经网络,甚至你都没有意识到它的存在:
在谷歌搜索图片的时候;
使用 Skype 翻译功能的时候;
在 Facebook 上给自己和朋友的图片点赞的时候;
甚至是召唤 Siri 或 Cortana 的时候。
这项技术令人激情澎湃但却又让人有点头疼。它不仅给我们带来了 DeepDream 这类图像软件,但同时亦提供了高精度脸部识别的能力。而这意味着私人隐私的终结。人们的担忧远不止这一个。Motherboard 今年早些时候写到:“当人工智能软件出错时,我们根本不知道为什么。”虽然神经网络的数学算法相对简单,但仍不少指令只由计算机生成,只有计算机能理解。这也就意味着,神经网络的技术人员也不一定明白计算机是如何做出决策的。
谷歌旗下的 DeepMind 公司也使用了神经网络来进行建库训练计算机,而训练后的计算机竟在极其复杂的围棋比赛中打败人类顶尖高手。DeepMind 被获准收集英国大量的医患数据,但这些数据将作何用 DeepMind 一直遮遮掩掩。
Facebook 也同样使用了神经网络来挖掘用户发表成千上万份帖子。在过去的二十年里,建议向军队和警务部门投入神经网络使用的文章也层出不穷。而我们从商品中获得的消费者数据,对科学家来说无疑是个巨大的金矿。这便是为什么早些年提出的“大数据”在近期又再一次火热起来。但是,这次人们对于人工智能,也就是神经网络所属的这个范畴有所疑问:我们应该对神经网络以及它的信息来源给予多少信任?
Kronick 对于神经网络的兴起表示担忧。那些研发人员总是相信“如果给系统输入的数据是好的,设计系统的意图也是好的,那么最后系统返回的结果必定是好的,这对世界的影响将是积极的,也是宝贵的。”虽然是这么说,但 Kronick 在的使用过程中并没有出现什么问题,神经网络一直很酷炫且不断在进步。
今年三月份,Kronick 和 Shi 发布了另一个神经网络项目 AI*Scry --一款 App 。他们戏称为“外星人思维控制的远程可视软件。AI*Scry 使用了斯坦福大学开发的“神经交谈”网络和微软的数据库,它可以分析手机指着的任何物品,并做出相应的描述反馈给你。但是据许多用户反馈,这款 App 经常出错:它对物品的描述有一定程度的抽象并带有自己的理解。比如说,此时我正用手机指着身下的这张蓝绿色沙发,软件给出的描述就十分抽象:“一张手腕搭在椅子上的图像,一列火车驶离的场景,一瓶在用电脑的可口可乐。”
砧板上放着一份披萨和一把刀;
桌上放着一把剪刀和一把勺子;
一个有着红色牙刷头和红色把手的红色牙刷;
玩具熊的旁边有一张床,床上躺着一只猫
一只猫盖着毯子躺在床上;
一只黑猫躺在床边的床上;
一只猫坐在床上的枕头上;
玩具熊的旁边有一张床,床上躺着一只猫;
一只猫裹着毯子坐在床上
AI*Scry 对笔者所养之猫的描述
艺术家 Kyle McDonald 在阿姆斯特丹使用神经网络进行视频录制时也遇到了同样的问题。神经网络对某些事情的判断挺准确,但也经常犯一些低级错误引得人们哈哈大笑。比如,把一盒甜甜圈认成一盒三明治,把走路的人认成在骑滑板。
这种对真实世界的曲解正是这些艺术家们想要揭露的事实。这些神经网络系统产生的曲解源自程序开发者对事物的偏见,因为神经网络系统是用开发者所选的图像来进行训练的。这就是为什么这个系统在某些场合下能辨认出这个物体,而换了一个场合它就可能辨认不出,甚至闹笑话了。在现实生活中确实存在这种问题,举这个例子我没有任何冒犯的意思:2015年,有人在谷歌图片搜索大猩猩时出现了黑人的照片,这或许是因为谷歌数据库里没有足够的黑人图像数据,也有可能因为谷歌的大部分雇员都是白人。
Kronick 告诉笔者:“我们可以利用艺术来了解事情真相”。
AI*Scry 项目发起时,Kroncik 告诉 TechCrunch 说:“这个系统的设计是一个完整的链条,我们有设计师、劳工和白领。他们用经验来告诉系统哪些数据有用,哪些数据没用。”
William Gibson 的科幻小说《幽灵国度》里这样写道:“通常,一门新技术的发展情况应该是这样:最有趣的应用不是在战场上诞生,就是在画廊中出现。”也正是基于这种情感,Data & Society 研究机构的研究员Tim Hwang 在人工智能及其政策上反复劝告谷歌。Hwang 把机器学习艺术比作军事研究与计算机图形研究中产出的早期计算机艺术。
Hwang 称机器学习的研究员们看到这篇文章会很高兴。
“人们对于把人工智能应用于文化领域这一想法十分激动,因为长久以来它只是一种技术生产工具。在研究深层学习的这群人里,有这样一种认知正在逐渐萌芽:不管我们的目的是什么,更重要的是要用恰当的术语让民众理解它,而且要让更多的民众能使用它。”
实现这一设想指日可待。不仅艺术家们也在尝试着阐明这些系统的工作原理。一些可控的机器学习项目,如 Andrej KarPathy 和艺术家兼程序员的 Gene Kogan 所推广的项目,也开始面向民众开放。
“专业的”文字工作者
图像只是艺术家们在神经网络中主攻的一个小方向。作家,尤其是科幻小说作家可就如鱼得水了。六月上旬,一部名为《Sunspring》的短片在 Ars Technica 网站首映。这部短片引起了极大的关注,因为它是由一个名为 Benjamin 的人工智能所完成的创作,Benjamin 事先一直以科幻小说剧本进行建库训练。(硅谷的家庭剧明星 Thomas Middleditch 在这部9分钟的短片中饰演男主。)
在片中,时间设定在模糊的未来,穿着金色夹克的 Middleditch 和另外两个角色在房间里讲着 Benjamin 所写的台词,时而眉头紧锁时而露出轻松愉快的面容。这部短片最引人的地方就在于它的演员和那偶尔语无伦次的对话。这部短片的台词对计算机来说有其自己的意思——“在未来,失业率居高不下,年轻人不得不靠卖血维生。我也只能这么做了。”——但总的来说,这部短片的编剧确实很专业。如果你不用眼睛看,纯靠耳朵听或从书中读的话,这部短片的神奇之处也就不复存在了。
H 从架子上拿下了一本书,边说边翻,不一会就翻完了,于是他又把它放了回去。
H 说:“在未来,失业率居高不下,年轻人不得不靠卖血维生。我也只能这么做了。”
H2 说:“你应该闭上你的嘴,看着这群男孩们。我现在应该100岁了才对。”
H 说:“我又看见他了。你出现的这个方式...确实是一个好主意。我的未来没有希望。”
C 说:“好吧,我要到我的脑颅里去一趟。我不知道。”
他拿起了那个平板,一束绿光照在了他的脸上,好像传送了一些什么。
Sunspring 的部分剧本
今年早些时候,由神经网络编写的一部音乐剧《Beyond the fence》也是一样,讲述的是20世纪80年代的反战主义者。由于没有演员,这些台词读起来很乏味,像是一首奇怪的僵尸诗:
我的老婆很伟大
这次谋杀是一个奇迹
这个洞更好有如飞翔
我应该来点 carbour 时光
我知道它一直在悲伤中流逝
科幻小说作家 Robin Sloan 对人工智能与人类在剧本写作能力上的差距十分感兴趣。他自己发起了一个神经网络的辅助项目:一个基于现有神经网络的人工智能写作伙伴。它是一款文字处理软件的插件,通过大量的科幻小说语料库的训练后,它能根据人类编剧写的上一句自己写出下一句。Sloan 正在尝试用它来构建新剧里的一个角色。
Sloan 说:“整体来看这个角色的剧本是可读的,但当你进入这个角色时,感觉就会有点奇怪了。如果人们知道故事的这一部分是用这种奇怪的方式写出来的话,那将十分有趣。”
纯靠这个机器的话,它经常会写出如噩梦般的感恩节菜谱一类奇怪的台词。所以后期还需要人类进行梳理,修改那些奇怪的地方,使情节合情合理。
家住旧金山湾区的 Sloan 是在与大学友人的一次交谈后才对神经网络感兴趣的。Sloan 说:“他对这项技术的潜力十分看好,深信它会是一项划时代的技术。不仅仅是因为它很酷炫,是新鲜事物,而且这会是一笔非常非常大的生意。”
起初,在科幻小说之前,Sloan 是用的莎士比亚的作品来训练神经网络的。训练后就是不断的做细微的调整。Sloan 说,系统自己根本不知道应该往哪里使力,因为它不知道什么才是“酷炫又有趣”的。所以Sloan 一直在不断的调整优化系统,使它写的剧本朝着怪异、有趣但仍连贯的方向发展。
这与谷歌、Facebook 的工程师在神经网络的发展方向上形成了鲜明的对比,Sloan 就想要他的神经网络独竖一帜。Sloan 和神经网络一起新剧中构建的角色仍能表达出他的思想,仍是一部完整的故事。这个神经网络插件写出的剧本有种独特的韵味,使得其塑造角色的语言不那么像人类。但它独特的人性化写作本应该如此。Sloan 首次公开写到神经网络的时候说:“这种有生气的思维是一种强化方式、一种伙伴关系,一种对唱应答。”
我们并没有否认使用神经网络进行艺术创作的可能性。Sloan 提出了一个有意思的观点:在这些案例中,艺术本身并不是我们使用这项技术的目的。
“有些人开始效仿我们。虽然他们的设计还行,但真正的产品却很糟糕的。这些系统还并不完善,理所当然产品也不会太好。所以这还只是一种概念性艺术,甚至只是哗众取宠的噱头。”
深度学习确实很令人兴奋。它把科幻电影里的人工智能技术带到了我们身边,有了深度学习的计算机就有了类人般的智慧。大部分人都没有注意到的是,深度学习让产品变得更好、更快了。虽然它广泛应用于社会各个领域,从监狱到报社,但不得不说深度学习仍很难理解,亦如 Kate Crawford 和 Meredith Whitaker 近期所写一样“很难被看见”。
艺术家们使用神经网络揭开了这项技术的神秘面纱。虽然他们所用的神经网络较谷歌、Facebook 的神经网络相比只是一个精简版,但他们仍发现了一个问题:只有深度学习系统单独工作是不够的。但就是这样,他们学到了另一个经验:一个人陷入循环时,往往会产出更美丽的东西。