数智资源网
首页 首页 大数据 查看内容

人工智能的缘起

木马童年 2019-4-9 20:25 176 0

  背景 1956年的达特茅斯会议(Dartmouth Conference)被公认为是人工智能的起源。殊不知,1955年在洛杉矶召开的美国西部计算机联合大会(Western Joint Computer Conference)上已经展开了“学习机讨论会”(Sess ...

  背景

人工智能的缘起

人工智能的缘起

1956年的达特茅斯会议(Dartmouth Conference)被公认为是人工智能的起源。殊不知,1955年在洛杉矶召开的美国西部计算机联合大会(Western Joint Computer Conference)上已经展开了“学习机讨论会”(Session on Learning Machine)。讨论会的参加者中有两个人参加了第二年的达特茅斯会议,他们是奥利弗·赛弗里奇(Oliver Selfridge)和艾伦·纽厄尔(Alan Newell)。赛弗里奇发表了一篇关于模式识别的文章,而纽厄尔则探讨了计算机是否能下棋。他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Pitts),他最后总结时说“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智??但殊途同归”。这预示了随后的几十年人工智能关于“结构与功能”两条路线的斗争。

让我们先了解6位与达特茅斯会议相关的人。首先,会议的召集者麦卡锡(John McCarthy),当时是达特茅斯学院数学系助理教授。两年前的1954年,达特茅斯学院数学系同时有四位教授退休,这对达特茅斯这样的小学校而言是不可承受之痛,刚上任的年轻的系主任克门尼(Kemeny),两年前才在普林斯顿大学逻辑学家丘奇(Church)门下获得了逻辑学博士学位,于是跑到母校求援。克门尼从母校数学系带来了刚毕业的四位博士前往达特茅斯学院任教,麦卡锡就是其中之一。麦卡锡后来发明的LISP语言中最重要的功能eval,实际就是丘奇的lambda(λ)演算,他对逻辑和计算理论一直有强烈的兴趣,后半生致力于用数理逻辑把常识形式化。

会议的另一位有影响力的参加者是明斯基。他也是普林斯顿大学的数学博士,和麦卡锡在读书时就相熟。他的主要研究方向不是逻辑,尽管他后来写过计算理论的书,还培养过好几个计算理论的博士,其中就有图灵奖获得者布鲁姆(Manual Blum)。明斯基的博士论文做的是神经网络,他在麻省理工学院150周年纪念会议上回忆说,是冯·诺伊曼和沃伦·麦卡洛克(Warren McCulloch)启发他做了神经网络,但后来却和神经网络结下梁子。

赛弗里奇被后人提及不多,其实他也是人工智能学科的先驱。赛弗里奇在麻省理工学院时一直在维纳手下工作,是维纳最喜欢的学生,但是他没有读完博士。维纳《控制论》一书的第一个读者就是赛弗里奇。赛弗里奇是模式识别的奠基人,他写了第一个可工作的人工智能程序。后来他在麻省理工学院参与领导MAC项目,这个项目之后被分化为麻省理工学院计算机科学实验室和人工智能实验室。如今这两个实验室又合并为MIT CSAIL。

信息论创始人克劳德·香农(Claude Shannon)也被麦卡锡邀请参加了达特茅斯会议。香农比其他几位年长10岁左右,当时已是贝尔实验室的资深学者。其实麦卡锡和香农的观点并不一致,平日相处也不睦。香农的硕士和博士论文都是关于如何实现布尔代数方面的,由当时麻省理工学院校长布什(Bush)亲自指导。博士毕业后香农去了普林斯顿高等研究院,曾和爱因斯坦、哥德尔、外尔(Weyl)等共事。战争中,他一直在贝尔实验室做密码学工作,阿兰·图灵(Alan Turing)在1943年曾秘访美国,和同行交流破解德国密码的经验,期间和香农曾有会晤,一起聊过通用图灵机。战后香农去英国还回访过图灵,一起讨论计算机下棋的问题。香农内向,以前从没说过这段往事,直到1982年接受一次采访时才提起。1950年,香农在《科学美国人》发表过一篇关于计算机下棋的文章。

另外两位重量级参与者是纽厄尔和司马贺(Herbert Simon)。纽厄尔是麦卡锡和明斯基的同龄人,硕士也是在普林斯顿大学数学系读的,导师是冯·诺伊曼的合作者、博弈论先驱摩根斯顿。纽厄尔硕士毕业后加入着名的智库兰德公司,在兰德开会时认识了赛弗里奇,受其神经网络和模式识别工作的启发开展人工智能研究,但方法论走的却是另一条路。司马贺比他们三个大11岁,当时已是卡内基理工学院(卡内基梅隆大学的前身)工业管理系的年轻系主任。他在兰德公司学术休假时认识了纽厄尔,随后力邀纽厄尔到卡内基梅隆大学,并给纽厄尔颁发了博士学位,开始了终身合作。纽厄尔和司马贺代表了人工智能的另一条路线:符号派。他们后来把此哲学思路命名为“物理符号系统假说”。简单地说就是:智能是对符号的操作,最原始的符号对应于物理客体。这个思路和英美的经验主义哲学传统接近。他们共享了1975年的图灵奖,三年后司马贺获得诺贝尔经济学奖。

达特茅斯会议筹备

1953年夏天,麦卡锡和明斯基与香农一起都在贝尔实验室工作。香农当时的兴趣是图灵机以及是否可以用图灵机作为智能活动的理论基础。麦卡锡建议香农编一本文集,邀请当时做智能研究的专家贡献文章。这本文集直到1956年才以《自动机研究》(Automata Studies)为名出版,书名是香农起的,但麦卡锡认为这并没有反映他们的初衷。文集的作者有两类人,一类是逻辑学家(后来都变成计算理论家了),如丘奇的两个优秀的学生马丁·戴维斯和克里尼。明斯基、麦卡锡也都有文章被收录,香农本人贡献了一篇关于只有两个内部状态的通用图灵机的文章,文集还收录了冯·诺伊曼的一篇开创容错计算的论文。文集的另一类作者几乎都是维纳的信徒,如阿什比(Ross Ashby)等,以控制论为基础。麦卡锡不喜欢控制论和维纳,但又觉得香农太过于理论,于是想独立门户,只专注于用计算机实现智能。他开始筹划举办一次活动。

1955年夏天,麦卡锡到IBM学术访问时遇见IBM第一代通用机701的主设计师罗切斯特(Nathaniel Rochester)。罗切斯特对神经网络素有兴趣,于是两人决定第二年夏天在达特茅斯学院举办一次活动。他俩说服了香农和当时在哈佛大学做初级研究员(junior fellow)的明斯基一起给洛克菲勒基金会写了一份项目建议书,希望得到资助。

麦卡锡给这个活动起了一个当时看来别出心裁的名字:“人工智能夏季研讨会(Summer Research Project on Artificial Intelligence)”。普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。麦卡锡晚年回忆说,一直有印象“人工智能”这个词最早是从别人那里听来的。后来英国数学家菲利普·伍德华德(Woodward)给《新科学家》杂志写信说麦卡锡是听他说的,因为他1956年曾去麻省理工学院交流,见过麦卡锡。但麦卡锡在1955年就开始用“人工智能”了,如今最后一位当事人明斯基也已仙逝,“人工智能”的来源恐怕要成悬案了。

大家最初对“人工智能”这个词并没有达成共识,很多人认为任何事情一加“人工”就变味了。纽厄尔和司马贺一直主张用“复杂信息处理”这个词,以至于他们发明的语言就叫IPL(Information Processing Language)。从某种意义上说,他们是偏功能学派,找到智能的功能不一定非得依靠结构相同或相似。图灵机和递归函数等价,但结构完全不同,所以他们强调“信息处理”。他俩一开始就颇不喜欢“人工智能”这几个字。直到1958年在英国国家物理试验室(NPL)召开的“思维过程机器化(Mechanisation of Thought Process)”会议上,有人再提“人工思维(artificial thinking) ”的说法,司马贺等人才逐渐接受了人工智能的说法。司马贺晚年还写了《人工科学》(The Science of the Artificial)这本书,把“人工”这个词放大了。

达特茅斯会议与人工智能历史

历史研究有两种方法——基于事件的与基于问题的。人和事的陈述属于前者。纽厄尔在1981年为一本颇为有料的文集《信息研究》贡献的一篇文章“人工智能历史的智力问题”就属于后者。纽厄尔的方法挺有意思,把人工智能历史当作斗争史,把历史分为两条路线的斗争,于是历史成了一串对立的议题,如“模拟与数字”、“串行与并行”、“取代与增强”、“语法与语义”、“机械论与目的论”、“生物学与活力论”、“工程与科学”、“符号与连续”、“逻辑vs.心理”等。在每一个议题下有进一步可分的子议题,如在“逻辑与心理”下又有“定理证明与问题求解”等。

被提到最多的是“人工智能与控制论”。在谷歌Ngrams里显示“Cybernetics”和“Artificial Intelligence”两个词在谷歌图书搜索(Google Books)里出现的词频,可以看出学科的跌宕起伏,如图1所示。“人工智能”这个词真正被共同体广泛认可是在10年后——1965年伯克利大学的欧陆派哲学家德雷弗斯(Hubert Dreyfus)发表了“炼金术与人工智能”一文之后。这篇文章一开始只是针对纽厄尔和司马贺的工作,几年后演变成了着名的(或者被人工智能学者称为“臭名昭着”的)《计算机不能干什么》一书,把整个人工智能当作批判的靶子。

麦卡锡和明斯基向洛克菲勒基金会提交的建议书里罗列了他们计划研究的七个领域:(1)自动计算机,这里的“自动”指的是可编程;(2) 编程语言;(3) 神经网络;(4) 计算规模的理论(theory of size of a calculation),这里指的是计算复杂性,明斯基后来一直认为计算理论是人工智能的一部分;(5) 自我改进,这里指机器学习;(6) 抽象;(7) 随机性和创见性。

麦卡锡的原始预算是13500美元,但洛克菲勒基金会只批准了7500美元。麦卡锡预计会有6位学术界人士出席,会议应该支付每人1200美元的薪水。除了那6位学术界人士外,还有4人也参加了达特茅斯会议。他们是来自IBM的撒缪尔(Arthur Samuel)和伯恩斯坦,一个研究跳棋,另一个研究象棋。达特茅斯学院的教授摩尔(Trenchard More)也参加了会议,而另一位被后人忽视的先知是所罗门诺夫。

和其他人不同,所罗门诺夫在达特茅斯学院待了整整一个暑假。他1951年在芝加哥大学取得物理硕士学位后就来到了麻省理工学院。在芝加哥对他影响最大的是哲学家卡尔纳普。有意思的是,神经网络的奠基者之一皮茨也受惠于卡尔纳普。司马贺的回忆录里也讲到他在芝加哥时听卡尔纳普的课受到启蒙才开始了解逻辑学,从而对与智能相关的问题感兴趣。这么说来,人工智能的两大派:逻辑和神经网络都起源于卡尔纳普。卡尔纳普当时的兴趣是归纳推理,这也成为所罗门诺夫毕生的研究方向。所罗门诺夫后来结识了明斯基和麦卡锡,在他们的影响下开始研究逻辑和图灵机。达特茅斯会议时,他受麦卡锡“反向图灵机”和乔姆斯基文法的启发,发明了“归纳推理机”。他的工作后来被苏联数学家柯尔莫格罗夫(Kolmogorov)重新独立发明了一遍,即“柯尔莫格罗夫复杂性”和“算法信息论”(加拿大滑铁卢大学教授李明是这个领域的着名专家,曾有专着)。柯尔莫格罗夫1968年开始引用所罗门诺夫的文章,使得后者在苏联的名声比在西方更加响亮。所罗门诺夫的另一个观点“无限点”后来被未来学家库兹维尔改名“奇点”。目前人工智能中广泛用到的贝叶斯推理也可以见到所罗门诺夫的开创性痕迹。

按照麦卡锡和明斯基的说法,上述10个人参加了达特茅斯会议,但现在有证据表明也有其他与会者,包括后来一直做神经网络硬件研究的斯坦福大学电机系教授维德罗(Bernard Widrow)。他回忆说他也去了达特茅斯学院并且在那待了一周。给所有人留下深刻印象的是纽厄尔和司马贺的报告,他们公布了一款“逻辑理论家”的程序,可以证明怀特海和罗素《数学原理》中命题逻辑部分的一个很大的子集。司马贺回忆录里说自己学术生涯最重要的两年就是1955年和1956年。纽厄尔和司马贺的报告后来成为人工智能历史上最重要的文章之一。当时有一段有趣的插曲:这篇文章最早是投给逻辑学最重要的刊物《符号逻辑杂志》的,但被主编克里尼退稿,理由是“把一本过时的逻辑书里的定理重新证明一遍没什么意义”。纽厄尔和司马贺给罗素写信报告这一结果,但罗素不咸不淡地回复说:“我相信演绎逻辑里的所有事,机器都能干。”

值得注意的是“逻辑理论家”对人工智能后来的一个分支“机器定理证明”的影响并不大。哲学家王浩1958年夏天在一台IBM-704机上,只用9分钟就证明了《数学原理》中一阶逻辑的全部定理。当然《数学原理》中罗列的一阶逻辑定理只是一阶逻辑的一个子集。目前,一阶逻辑的机器定理证明比起50年代已有长足进展,但仍然没有更高效的办法。毕竟,王浩证明的是一阶逻辑,而“逻辑理论家”只能处理命题逻辑。数学家马丁·戴维斯和哲学家普特南合作沿着王浩的思路进一步提出了戴维斯-普特南证明过程,后来进一步发展为DPLL。王浩在1983年被授予定理证明里程碑大奖,被认为是定理证明的开山鼻祖。司马贺在回忆录里对此表示不满,认为王浩的工作抵消了“逻辑理论家”的原创性,他们的初衷并不是要有效地证明定理,而是研究人的行为。

麦卡锡多年后回忆说:他从纽厄尔和司马贺的IPL语言中学到了表处理,这成为他后来发明LISP的基础。明斯基后来接受采访时说,他对纽厄尔和司马贺的“逻辑理论家”印象深刻,因为那是第一个可工作的人工智能程序。但事实上,明斯基当时为大会写的总结里对“逻辑理论家”只是轻描淡写。因为他与麦卡锡举办会议旨在创立一门新学科,但纽厄尔和司马贺却抢了他们的风头。

会议之后

达特茅斯会后不久,1956年9月IRE(后来改名为IEEE)在麻省理工学院召开信息论年会,麦卡锡被邀请作一个对一个月前达特茅斯会议的总结报告,这引起司马贺的不满。经过多方协调,最后决定由麦卡锡先作总结报告,然后纽厄尔和司马贺报告他们的“逻辑理论家”,并发表一篇题为“Logic Theory Machine”的文章。

1956年的IRE信息论年会是个值得纪念的会议,除了纽厄尔和司马贺发表的那篇文章之外,心理学家乔治·米勒(George Miller)发表了“Human Memory and the Storage of Information”,这是着名的“The Magic Number Seven”文章的另一个版本。同时,乔姆斯基发表了“语言描述的三种模型(Three Models for the Description of Language)”,该文证明了有限状态句法不能表达某类语言,这是乔姆斯基分层的起源,文中引用了当时尚未出版的不朽名着《句法结构》。乔姆斯基当时刚刚到麻省理工学院现代语言学系(该系后来演变为语言学与哲学系)出任助理教授,并在麻省理工学院电子实验室做机器翻译的研究。

从参与者的角度看,大家认为IRE的信息论年会比达特茅斯会议更重要,影响也更深远。乔治·米勒回忆说,他当时的直觉是实验心理学、理论语言学、认知过程的计算机模拟,都是一个“大家伙”里面的组成部分。这个所谓的“大家伙”就是现在的人工智能加认知科学。

麦卡锡1958年离开达特茅斯学院去了麻省理工学院,帮助麻省理工学院创立了MAC项目,和明斯基一起领导了MAC项目中的人工智能实验室,1962年他再次跳槽到斯坦福大学。MAC项目孕育了计算机科学中很多原创的概念。以至于明斯基后来认为UNIX系统是落后反动的东西,因为他们丢掉了很多Multics中的精华。计算机操作系统里“分时”的概念是由麦卡锡在MAC项目中首创的。他回忆说,当时机器太少,但等着上机的学生很多,于是就提出了分时系统概念。按说分时系统的贡献要比麦卡锡后来的人工智能更为彰显,但麦卡锡得图灵奖也不是靠“分时”,这就像爱因斯坦并不是因为相对论获得了诺贝尔奖一样。从这个意义上讲,人工智能有点像哲学——自身衍生出很多问题,而对这些问题的解决又产生出许多子学科;一旦这些子学科独立,就不再喜欢“人工智能”了。

1968年,参议院多数党领袖曼斯菲尔德对ARPA(Advanced Research Projects Agency)的资助方向不满,认为国防部的钱不能用于军事目的之外,非军事目的的项目应该由美国国家科学基金会(NSF)负责。于是,ARPA改名为DARPA。70年代初期在海尔梅尔(George Heilmeirer)任期内,他以人工智能不能帮助制造武器打仗为理由,大幅削减了人工智能的经费,转而重金资助了隐形飞机和空间武器技术,使美国在相关领域一直保持领先。由于协调政府和麻省理工学院人工智能实验室的工作头绪繁多,明斯基决定从人工智能实验室退位,让他刚毕业的学生温斯顿(Patrick Winston)接手。

尽管明斯基说他不喜事务性工作,但在他的采访和回忆中,触及的话题总是和联邦政府的资助有关。温斯顿后来回忆时说:成功地管理一个实验室要管理好三个圈子,即出资人(主要是政府)、科学上有创建的人、有国计民生价值的项目。温斯顿试图说服几任ARPA的领导别把人工智能当作一个几年一次的项目,而是长期而独立的一门学科。ARPA对人工智能的资助在克罗克(Steve Crocker)在任时才逐步恢复,后来的ARPA信息技术办公室的负责人中还有图灵奖获得者苏泽兰(Sutherland),也继续对人工智能进行了投入。另外温斯顿对比了早期ARPA和NSF的不同,NSF给钱少,而且都是同行评议制,结果是越有成就的学者得到的资助越多,但很少会有根本性的原创性的贡献。而ARPA早期都是项目负责人制,如果负责人品味好,则有可能支持到好的研究项目,比如ARPA也支持了ARPAnet,后来演变成互联网。这类项目如果通过同行评议是很难实施的。这点非常值得国内科技界借鉴——精英制风格的ARPA更适合做大型开创性项目,有时,能否成功取决于少数的决策者;而以民主制为基础的NSF,历来就是小规模资助的基础研究。

预测未来:会有奇点吗?

司马贺在1957年曾预言10年内计算机下棋会击败人。1968年麦卡锡和国际象棋大师列维(David Levy)打赌说,10年内程序下棋会战胜列维,最后赔了列维2000美元。乐观的预言总会给对手留下把柄:德雷弗斯后来每年都拿此事嘲讽人工智能,说计算机下下跳棋还行,下国际象棋连10岁的孩子都比不过。但这种说法在1997年 IBM深蓝击败卡斯波罗夫后便不攻自破了。1995年卡斯帕罗夫还在批评计算机下棋缺乏悟性,但1996年他已经开始意识到“深蓝”貌似有悟性了。而两年间“深蓝”的计算能力只不过提高了一倍而已。当时,司马贺和日本计算机科学家宗像俊则(Munakata)合写了一篇解气的文章“AI Lessons”,刊登在《ACM通讯》上。现在两台普通计算机对弈,人类下棋高手都看不懂了,所有棋手现在都用机器做教练。

当然,德雷弗斯们还可以将“计算机仍然不能干什么”,并加上若干个“仍然”接着批评。明斯基1968年在库布里克的电影2001:A Space Odyssey的新闻发布会上曾大胆预言,30年内机器智能将赶上人类,1989年又预言20年可以解决自然语言处理。然而,现在我们恐怕还不能说机器翻译令人满意。过分乐观的另一个原因,按照明斯基的说法是,一门年轻的学科,一开始都需要一点“过度销售”。但过头了就不免被人当作狗皮膏药或炼金术。

2006年,达特茅斯会议召开50周年,10位当时的与会者有5位仙逝,在世的摩尔、麦卡锡、明斯基、赛弗里奇和所罗门诺夫在达特茅斯学院重新团聚,忆往昔展未来。参加50周年庆祝会之一的霍维茨(Horvitz)现在是微软实验室的一位领导,他和夫人拿出一笔钱捐助了斯坦福大学的一个AI 100的活动,目的是在未来100年,每5年要由业界精英出一份人工智能进展报告。第一期已于2015年底发表。

乔姆斯基晚年边做学问边做斗士。2015年3月,他和物理学家克劳斯对话时被问及“机器会思考吗?”,他套用计算机科学家迪杰斯特拉(Dijkstra)的说法反问:“潜艇会游泳吗?” 如果机器人可以有意识的性质,那么机器人可以被认为有意识吗?他进一步说“意识”是相对简单的,而“前意识”是困难的。他把人工智能分成工程和科学。人工智能工程,如自动驾驶汽车等,能做出对人类有用的东西;而人工智能科学,乔姆斯基明显不认可。他引用图灵的话——这问题没有意义,不值得讨论。当一帮奇点理论的粉丝带着正面的期望采访乔姆斯基时,他却对人工智能这个被他深刻影响过的学科没太当回事,他认为气候和毁灭性武器是比奇点更紧迫的问题。这算有意回避吧。

明斯基在2012年时曾接受他的学生、预言家、奇点理论炮制者库兹维尔的采访。他说相信奇点的到来,可能就在我们的有生之年。两位“斯基”在麻省理工学院150周年纪念会上,参加同一个研讨小组,但却只打了一下“太极”,并没有针锋相对。倘若他们能在2016年达特茅斯会议60周年时面对面论剑一番,肯定会很精彩。然而,明斯基已溘然长逝。

来源:《中国计算机学会通讯》2016年第3期《专栏》

人工智能 计算机 神经网络 计算机科学 创始人 模式识别
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...