首页 首页 大数据 大数据入门 查看内容

Google研究总监Peter Norvig:人工智能的另一面

木马童年 2018-10-13 19:16 28 0

Peter Norvig是誉满全球的人工智能专家,Google研究总监(Director of Research),他同时也是经典书籍《人工智能编程范式:Common Lisp案例研究》(Paradigms of AI Programming: Case Studies in Common Lisp)和 ...

Peter Norvig是誉满全球的人工智能专家,Google研究总监(Director of Research),他同时也是经典书籍《人工智能编程范式:Common Lisp案例研究》(Paradigms of AI Programming: Case Studies in Common Lisp)和《人工智能:一种现代方法》(Artificial Intelligence: A Modern Approach)的作者/合著者。在本文中,我们将看到Peter Norvig对人工智能目前进展和未来发展的思考,对人工智能技术在Google应用的解读,以及对最新软件工程师在人工智能时代的成长的观点。

Google研究总监Peter Norvig:人工智能的另一面

Peter Norvig眼中的人工智能

问:人工智能领域在哪些方面发生了您未曾预料的演变?

Peter Norvig:在1980年我开始从事人工智能研究时人工智能意味着:一位研究生用说明性语言写下事实,然后拨弄这些事实和推理机制,直到从精心挑选的样本上得到不错的结果,然后写一篇关于它的论文。

虽然我接受并遵循这种工作模式,在我获得博士学位的过程中,我发现了这种方法的三个问题:

  • 写下事实太慢了。

  • 我们没有处理异常情况或模糊状态的良好方法。

  • 这个过程不科学——即使在选定的样本上它能工作,但是在其他样本上工作效果会如何呢?

整个领域的演变回答了这三个问题:

  • 我们依靠机器学习,而不是研究生付出的辛苦努力。

  • 我们使用概率推理,而不是布尔逻辑。

  • 我们希望使用科学严格的方式;我们有训练数据和测试数据的概念,而且我们也有比较不同系统处理标准问题所得到的结果。

1950年,阿兰图灵写道:“我们只能看到未来很短的一段距离,但是我们很清楚还有什么需要完成。”自从1950年,我们已经得到许多发展并实现了许多目标,但图灵的话仍然成立。

问:对于机器学习研究,工业界与学术界有何不同呢?

Peter Norvig:我认为,在教育机构、商业机构还是政府机构并不是很重要——我曾经在这三种机构都学到很多东西。

我建议你在有着一群出色同事和有趣问题的环境下工作。可以是工业界、学术界、政府或者非营利企业,甚至开源社区。在这些领域里,工业界往往有更多的资源(人、计算能力和数据),但如今有很多公开可用的数据供你使用,一个小团队,一台笔记本电脑,或者一个小而廉价的GPU集群,或者在云计算服务上租赁或捐献时间。

问:您对深度学习有什么看法?

Peter Norvig:我清楚地记得80年代初的那一天,Geoff Hinton来到伯克利进行了关于玻尔兹曼机的讲座。对我来说,这是个了不起的视角——他不赞同符号主义人工智能很强大很有用,而我了解到了一种机制,有三件令人兴奋的新(对我而言)事情:根据大脑模型得出的认知合理性;从经验而不是手工编码中学习的模型;还有表示是连续的,而不是布尔值,因此可以避免传统符号专家系统的一些脆弱问题。

事实证明,玻尔兹曼机在那个时代并没有广泛普及,相反,Hinton、LeCun、Bengio、Olshausen、Osindero、Sutskever、Courville、Ng以及其他人设计的架构得到很好的普及。是什么造成了这种不同呢?是一次一层的训练技术吗?是ReLU激活函数?是需要更多的数据?还是使用GPU集群可以更快地训练?我不敢肯定,我希望持续的分析可以给我们带来更好的了解。但我可以说,在语音识别、计算机视觉识别物体、围棋和其他领域,这一差距是巨大的:使用深度学习可以降低错误率,这两个领域在过去几年都发生了彻底变化:基本上所有的团队都选择了深度学习,因为它管用。

许多问题依然存在。在计算机视觉里,我们好奇深度网络实际上在做什么:我们可以在一个级别上确定线条识别器,在更高层次确定眼睛和鼻子识别器,然后就是脸部识别器,最终就是整个人的识别器。但在其他领域,一直很难了解网络在做什么。是因为我们没有正确的分析和可视化工具吗?还是因为实际上表示不一致?

在有许多数据的时候,深度学习在各种应用中表现不错,但对于一次性或零次学习,需要将一个领域的知识转移并适应到当前领域又如何呢?深度网络形成了什么样的抽象,我们可以如何解释这些抽象并结合它们?网络会被对抗性输入愚弄;我们如何预防这些,它们代表了根本缺陷还是不相干的把戏?

我们如何处理一个领域中的结构?我们有循环网络(Recurrent Networks)来处理时间,递归网络(Recrsive Networks)来处理嵌套结构,但这些是否已经足够,现在讨论还为时过早。

我对深度学习感到兴奋,因为很多长期存在的领域也是如此。而且我有兴趣了解更多,因为还有许多剩余问题,而且这些问题的答案不仅会告诉我们更多关于深度学习的东西,还可以帮助我们大体理解学习、推理和表示。

问:在深度学习最近取得的成就之后,符号主义人工智能是否还有意义?

Peter Norvig:是的。我们围绕着符号主义人工智能开发了许多强大的原理:逻辑预测、约束满足问题、规划问题、自然语言处理,乃至概率预测。因为这些算法的出色表现,我们处理问题的能力比原来提升了几个数量级。放弃这一切是件可耻的事。我认为其中一个有意识的研究方向是回过头看每一种方法,探索非原子式符号被原子式符号取代的这个过程究竟发生了什么,诸如Word2Vec产生的Word Embedding之类的原理。

下面是一些例子。假设你有这些逻辑“事实”:

  1. 人会说话;

  2. 除人以外的动物不会说话;

  3. 卡通人物角色会说话;

  4. 鱼会游泳;

  5. 鱼是除人以外的动物;

  6. Nemo是一个卡通人物;

  7. Nemo是一条鱼;

  8. 那么我们要问了:

  9. Nemo会说话吗?

  10. Nemo会游泳吗?

用逻辑来表述和解释这个场景的时候遇到了两个大问题。首先,这些事实都有例外,但是用逻辑很难穷举这些例外情况,而且当你逻辑出错的时候预测就会出问题了。其次,在相互矛盾的情况下则逻辑无能为力,就像这里的Nemo既会说话又不会说话。也许我们可以用Word Embedding技术来解决这些问题。我们还需要Modus Ponens Embedding(分离规则,一种数学演绎推理规则)吗?不学习“如果A且A暗示B,则B”这样一种抽象的规则,我们是否可以学习何时应用这种规则是恰当的?我觉得这是一个重要的研究领域。

再说一点:许多所谓的符号主意人工智能技术实际上还是优秀的计算机科学算法。举个例子,搜索算法,无论A*或是蚁群优化,或是其它任何东西,都是一种关键的算法,永远都会非常有用。即使是基于深度学习的AlphaGo,也包含了搜索模块。

问:我们哪儿做错了?为什么Common Lisp不能治愈世界?

Peter Norvig:我认为Common Lisp的思想确实能治愈这个世界。如果你回到1981年,Lisp被视作是另类,因为它所具有的下面这些特性还不被C语言程序员所知:

  1. 垃圾回收机制;

  2. 丰富的容器类型及相应的操作;

  3. 强大的对象系统,伴随着各种继承和原生函数;

  4. 定义测试例子的亚语言(sublanguage)(并不属于官方版本的一部分,但我自己配置了一套);

  5. 有交互式的读入-运算-打印循环;

  6. 敏捷的、增量式的开发模式,而不是一步到位的模式;

  7. 运行时对象和函数的自省;

  8. 能自定义领域特定语言的宏。

如今,除了宏之外的所有这些特性都在主流编程语言里非常常见。所以说它的思想取胜了,而Common Lisp的实现却没有 —— 也许是因为CL还遗留了不少1958年编程语言的陋习;也许只是因为一些人不喜欢用大括号。

至于说宏,我也希望它能流行起来,但当用到宏的时候,你成为了一名语言设计者,而许多开发团队喜欢保持底层语言的稳定性,尤其是那些大团队。我想最好有一套使用宏的实用指南,而不是把它们全部抛弃(或是在C语言里严格限制的宏)。                

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

人工智能 工程师 机器学习 计算能力 云计算 深度学习
0
为您推荐
大数据分析:PC端VS移动端中的搜索引擎

大数据分析:PC端VS移动端中的搜索引擎

还没搞清楚PC的时候,移动互联网来了,还没搞清楚移动互联网的时候,大数据来了。今天…...

数据挖掘领域十大经典算法之—K-Means算法(超详细附代码)

数据挖掘领域十大经典算法之—K-Means算法

简介 又叫K-均值算法,是非监督学习中的聚类算法。 基本思想 k-means算法比较简单…...

2014年全球及中国互联网数据全景

2014年全球及中国互联网数据全景

全球活跃社交用户于 2014 年 8 月突破了 20 亿人;全球独立移动设备用户渗透率于 2014 …...

Hadoop能够风行十年吗

Hadoop能够风行十年吗

Hadoop技术已经无处不在。不管是好是坏,Hadoop已经成为大数据的代名词。短短几年间,…...

大数据技术之争:PIG对Hive

大数据技术之争:PIG对Hive

Pig与Hive已经成为企业实现大规模数据交互的必要工具,其突出优势在于无需编写复杂的M…...

阿里双11大数据  移动电商的名头已坐实

阿里双11大数据 移动电商的名头已坐实

全民网络购物狂欢节已经结束,最终的成交额定在571亿,这与阿里早期的预估值不相上下…...