首页 首页 人工智能 查看内容

当机器可以做梦,会是它们拥有创造力的起点吗?

木马童年 2019-4-30 16:20 57 0

当我们放任大脑漫游,无论处于清醒还是混沌状态,大脑都会混合或是重组我们的经历,创造出一些略显怪异的图像或体验,甚至可能是幻觉。 这些白日梦中,有时候是我们在一座山的一侧看见鲸鱼漫游在云层中,这当然没有 ...

当我们放任大脑漫游,无论处于清醒还是混沌状态,大脑都会混合或是重组我们的经历,创造出一些略显怪异的图像或体验,甚至可能是幻觉。

这些白日梦中,有时候是我们在一座山的一侧看见鲸鱼漫游在云层中,这当然没有任何意义。而有时候也会变得颇具意义,比如化学家Friedrich Kekulé,这位科学家在自己著作中声称他在梦见一条蛇首尾相接的时候发现了苯环结构。

毫无疑问,我们就是这样一个为各种梦境着迷的族群,这也造就了人类从噪音中找到出乎意料新模式的神奇能力,也正是这样成就了如今的人类的创造力。

这也解释了在Google公布一组令人难以置信的类似梦境的图片所引起的轰动。因为这些特别的图片是由计算机凭空「梦出来」的。

当机器可以做梦,会是它们拥有创造力的起点吗?

谷歌通过inceptionism生成的图片来启动整个项目,像电影一样进行图片回放,相类似地,这些图片自身也从优美变得有些古怪。

那么,这究竟是怎么一回事呢?

近年来,互联网公司利用深度学习算法进行图像识别。这些公司通过向算法提供数以百万计的带标签图片(诸如「猫咪」、「奶牛」、「椅子」等等标签),算法据此学习并且去识别出未标记图片中的物品对象。目前,谷歌、微软、百度三家公司的识别效果成功通过了人类设置的测试标准。

在这种背景下,Google逆向了整个过程,他们基于已经存储在其人工神经网络中的信息,来驱动软件生成这些图片。

同时很有趣的一点在于:在实验的某一部分中,软件程式被允许进行「自由联想」,然后迫使它进入反馈回路从而加强这样的关联——结果是它发现了之前都不曾存在的图像和模式(通常是它已经看过的事物的聚合)。

在一些实验例子中它将叶子解读为鸟儿或者是把树木当做了建筑。在其他的实例中,它创造出奇异的漂浮在云层里的虚构野兽的图像——像是「海军狗」、「猪蜗牛」、「驼鸟」或者是「狗鱼」。

当机器可以做梦,会是它们拥有创造力的起点吗?

这看起来有点像我们人类自己的创造力。我们理解并接受了感官传递的内容,将它们在大脑中汇聚混合然后组成复杂的创意理念,其中一些显得比较荒唐无稽,另一些则更加意味深长。

但机器生成的这些图片与人类大脑臆想的图片是同一回事吗?答案显然是否定的。让我们先来看看两位「古人」的看法。

作为大诗人拜伦的女儿,Ada Lovelace(被誉为计算机历史上第一位女程序员——译者注)最早提出了关于现代计算机上运行的软件和程式的理念,但同时她对机器的创造力充满了质疑。

她这样写道:「这种分析机(也就是Ada Lovelace眼中的计算机——译者注)无论如何伪装都无法生成任何东西。的确,它能够完成任何任务,只要我们知道怎么对它下达指令,它就可以跟进分析,但是它没有能力可以参与到与联想有关的分析工作中。」

换句话说,机器只能做我们告诉它们需要做的事情,其他的就无力为之了。

图灵并不同意Lovelace关于「机器永远不会做什么令人吃惊的事」的观点。在图灵看来,他的机器就经常令他惊讶——而这主要来源于他能在一般意义上懂得机器的底层设置,而在具体实施中又带来令人惊讶的结果。

的确,谷歌对于启动这样一个实验,给出的理由是「我们实际上会发现我们对于某些特定模型为何运作成功或失败知之甚少。」换句话说,我们知道基本的理念和做法,但却经常不知道程序的下一步会发生什么稀奇古怪的事情。

人工神经网络,或多或少都是基于人脑,由人造神经元形成层次框架。每一个层次负责识别不同的、抽象的图像元素。比如,第一层可能被分派去寻找图片中的边与角。下一层就可能负责寻找基本的形状——持续自下向上的过程,直到最终的层次做出飞跃性的图片抽象来「拼凑」或者「组合」,完成一幅图的识别。

逆向这些算法能够让我们从中找出这些机器到底学到了什么。在其中一个实验中,研究员要求算法产生一个具体化图像。比如在随机的噪音(就类似电视机上的雪花点)中描述香蕉的概念。这是一个能确定机器到底多了解香蕉的方法。而在一个例子中,当被要求生成一个哑铃的图片时,软件反复执行后展示的却是被举在手上的哑铃。

谷歌的工程师在日志中记录道:「在这个例子中,神经网络没有成功地完全提取出『一个哑铃』这个单词的含义。或许它永远不会呈现一张没有手臂在其中的哑铃照片,可视化能够帮助我们纠正这样的训练错误。」

而当研究员「允许」算法去观察一张图片并且自由组合的时候,情况变得更加有趣了。而呈现的图像抽象程度取决于他们动用了哪一层次的人工神经元。

首先,抽象度较低的层次强调于处理图像的边。这会造成「类似装饰」的模式。其中一些模式效果你或许已经在照片美化App中见过了。但是更抽象的特征元素存在于更高的层次中,这些特征元素之后会在反馈回路的诱使下被进一步加重和强化。

研究员们要求他们的神经网络,「无论你看到什么,我想要得到更多。」

当机器可以做梦,会是它们拥有创造力的起点吗?

当机器可以做梦,会是它们拥有创造力的起点吗?

某种意义上,这些图片都是在程序员们的指挥下,正如Lovelace所言,机器从它的数据库中把图像内容放到我们面前,但同时它们也像图灵指出的那样,在一定程度上又让我们觉得震惊。

或许最令人震惊的正是他们在处理/输出过程中与人类进行创造时的情形很像——正如一个空想者能够在云层中找到古怪的形状抑或是一位抽象派艺术家创造超凡脱俗而又充满矛盾的景色。

如果把眼光放远,这又是一件多么令人激动的事情?

当机器接收了足够的图像、文字、其他感官数据,直到最终拥有与人类不相上下的丰富体验,又会发生什么呢?有没有一个像Google现在这个产品那样去引导机器重组这些经历,使其变为原创的点子呢?

更严肃的一个问题则是:我们如何在机器和人类的创造力之间划定界限?最终这个讨论会陷入某种死循环,也不可能明确得出这之间的差异。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

计算机 互联网 深度学习 图像识别 神经网络 程序员
0