首页 首页 人工智能 查看内容

搜狗CEO王小川:当下就是人工智能的时代

木马童年 2019-7-4 12:15 37 0

  搜索骨子里一开始就是对数据做挖掘和分析,再提供更好的判断选择给用户,搜索公司的灵魂就是人工智能。 中国论文网 https://www.xzbu.com/1/view-7499208.htm  EW:今年5月初你们推出搜狗明医并表示将优先展示 ...

  搜索骨子里一开始就是对数据做挖掘和分析,再提供更好的判断选择给用户,搜索公司的灵魂就是人工智能。 中国论文网 https://www.xzbu.com/1/view-7499208.htm  EW:今年5月初你们推出搜狗明医并表示将优先展示非商业、真实权威的医疗信息,这些承诺在技术手段上是怎么实现的?搜狗怎么避免出现百度那样的问题?

WXC:首先你得找着真实的权威的信息,这句话听起来简单,做起来真的很不容易。因为在互联网上,判断这个事情是非常难的。按照常规的理解,大数据会做一些识别,但真实的情况是大数据必须有标准,如果没有标准,没有训练,根本没法识别。比如说人脸识别,大数据也是先找一万个人识别完了,才有一套程序在。

针对搜狗明医,我们采取的方法有两点。第一件事是找到真实权威的数据,走白名单,去找相对权威专业的网站,比如说政府网站,比如说一些海外的权威信息网站,还有像知乎和丁香园。我们努力把这些数据引进来,我们希望这些数据背后要么有政府背书的,要么背后有真实的人。“真实的人”就是他有自己的职业,他看重自己的名誉,而不是一味的利益导向。拿知乎这个平台打个比方,有些人在上面回答问题,不是利益导向的,而且有无数双眼睛监督,他的观点可能有争议,但我们认为这是正向的一件事情。第二件事情是要分解用户的需求,这个需求是否跟医疗相关,如果跟医疗相关,我们就调这个数据系统。如果没做好,要么是我们没有找到真实数据,要么是最后没有识别出来用户。这是一个医疗相关的概念。

EW:搜狗跟这些真实数据源的网站谈合作的过程是什么样的?

WXC:我自己去拜访过丁香园,希望引入他们的一些数据。当然刚开始会有各种难度。在理念上,一开始会有一些困难,因为缺乏信任。因此第一件事是建立信任。他们相信你的初衷是把这个事情做好,相信你的本心,才会对你做出回应,这是之前信任的累积,这是一件需要不断持续、加强的事情。

其次他们本身有这样的数据,数据都挺好,但之前没有经过大众的检验。所以一放到大众面前,给他们带来挺大压力。这是一把双刃剑,中间存在这样一种情况,他们说压力太大了,对自己不满意,是不是先撤下去再改,我们一直在鼓励他们。搜索引擎行业就是这样一个毁誉参半的行业,你没法说在商业这个问题上面,没人骂你,但是只要你的东西是正向的,不必非常在意骂你的声音,否则反而会损失掉给大众服务的机会。因此他们反复讨论后还是拍板跟我们合作。

EW:这些事情都是你亲力亲为吗?

WXC:今年我参与比较多,搜狗明医有一个很好的开头,各种各样医疗相关的网站也好,机构也好,很多主动寻求跟我们合作。这里需要我们有体系化甄别,因为有的就属于纯商业导向冲过来,有的属于信息量不够,他以为自己很好,但是还需要去改进。这对搜狗来讲只是一小步,丁香园就是个很明显的例子,一开始他们很不信任你,我不跟你合作,后来发现你是真诚的,跟搜狗合作之后,发现对双方来说都是一种正向的促进。之前我们一直跟他们解释搜索引擎做判断不容易,他不相信反而觉得你是在找借口,但真正合作之后,他就能理解到真是挺难的。这就是一个相互促进的过程,这是个好事,大家能互相真正信任和理解。

EW:魏则西事件后,大家讨论搜索不作恶,在你看来搜索引擎的本质是什么?用户用搜索引擎的需求到底是什么?

WXC:搜索引擎是无所不知地对提问进行回答的引擎。而人工智能的终极理想,就是搜索引擎掌握了所有数据信息,具有推理能力,用户提问题后它能回答,谷歌现在做的就是这件事情。谷歌今年一季度发财报时,CEO就讲了,当下就是人工智能时代,我非常认同。当你连接搜索引擎之后,它就开始做判断选择,而搜索引擎的本质,就是它能给我答案,甚至能给我提供服务,甚至它能帮我联系其他人。它是中介,它是回答的机器和引导的机器,帮你做服务的中介。

EW:清华走出来很多创业者,你也是其中之一。你怎么看待当下这一代人的创业机会?当下是你创业最好的状态吗?

WXC:当下,互联网给了巨大的机会――你有自己的想法,自己去努力,就有机会去做,不像原来机会少,所以涌现出很多这样的创业。这个时代比以前会好很多。原来创业面临很多资金的压力,还有管理的问题,现在都会更少。未来资本充足,管理方法也成熟,你只要有想法,整个互联网创业的条件会越来越好。

我自己而言,不算是典型的创业。从过程来讲,一开始我是啃搜索,啃得死去活来的,特别艰难的一场战斗。从体制上说,搜狗是从搜狐里面作为一个孵化产品起步的,本身灵活性、自主性一开始相对偏弱。在这个过程中,我认为能学到的更多是在今后的工作里,能够更好地理解怎么去做顶层设计、怎么做前瞻性的工作。原来的东西可以称为经验教训,但是我认为这件事情对于今后怎么去工作,是巨大的财富。

EW:去年你跟着中国科技公司创始人团队,游学哈佛和硅谷,当时您有什么印象深刻的见闻?

WXC:美国的创业公司和中国的创业公司差不多,但是有一支力量不同,他们的核心就是围绕某一种学术成果,这种事情国内是很少的。另外像MIT(麻省理工学院),他们的实验室的前瞻性也好,对人本身的理解也好,是跳出来的。有时候在国内谈的还是技术本身,国外实验室谈的不是技术,谈的是未来。实验室谈未来,创业公司谈技术,这个和我们国内对比,还是有些不同的。

EW:过去这一年,关于技术的维度,你琢磨最多和你参与最多的是哪一个项目?

WXC:琢磨讨论最多的,其实不是我参与最多的,是我没参与成的AlphaGo(阿尔法围棋,一款围棋人工智能程序,由位于英国伦敦的谷歌旗下DeepMind公司的研发团队开发,2016年3月对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜)。

这个事情让我们产生太多的思考。一方面在人工智能技术里面,对理论比较清楚,对工程架构有很多理解,包括AlphaGo代表的流派里面,我的观点也是认为,会从人给机器答案变成机器自己去写。另外,参与旁观AlphaGo(大战李世石)这件事的过程中,重要的话题是机器会自己学习后,机器会不会产生意识,会不会产生自己的生存权意识。总之我对人工智能路径和终极问题,会有比较多的思考。   EW:从搜索到当下最热的AI概念,这之间的技术逻辑是怎么推演的,从搜索切入到AI技术,会有哪些具体的场景?

WXC:搜索的逻辑就是提供帮你做判断、做选择的服务。我们可以看BAT里面,阿里的产品是用来连接商家的,靠连接去做;腾讯不管是QQ还是微信,也是用来做连接的。但搜索不是,搜索骨子里一开始是对数据做挖掘、做分析,去理解用户想要什么,再提供更好的判断选择给用户,搜索就是AI的基本面。

未来在搜索里面,我们会考虑两大块事情,第一件事是用户的表达,可以基于文字,也可以基于语音,甚至可以是图片,或者肢体语言,这个需要搜索引擎能更多地去读懂用户。一个是人的表达,一个是环境表达,都不是基于文字。第二件事,是给用户提供的内容也不再只是简单的文字了,里面带有知识,带有推理的能力。

EW:清华校庆上,你捐了1.8亿元成立研究院,专门研究人工智能。从搜狗公司的维度来讲,你希望得到什么样的回馈?

WXC:企业品牌和实力决定了企业自己去孵化人工智能技术的时候是否需要借力,我认为我们需要走一种借力的方式。在人工智能这件事上,搜狗不是干得最早的,我们遇到的困难就是,我们有理想,干得很努力,但搜狗这个品牌现在还难以承载人工智能这么大的梦想,比如说让科学家来企业。科学家去阿里、去腾讯都有可能,但是请到搜狗来,现在难度还是蛮高的。

搜狗公司本身偏小的时候,不是选择做企业内部研究院,而是跟清华联动一块来做,这是我们的出发点。清华代表国内学术的制高点,而且有充分进行国际学术交流的能力。

我也跟国外顶尖的做人工智能的人聊,问他们做研究的目的是什么?他们说还是想产生影响,比如想对中国市场产生影响。光在美国有影响力是不够的,中国也是互联网大国。我就曾建议对方应该拿清华做跳板,跟清华交换学生或者交换技术,在这边做一个讲题教授,这样把你的技术带到国内来。这样的吸引力,比搜狗单个企业对他们的吸引力更大,更受这些人的认可。

清华之前跟搜狗已经有长达十年的搜狗实验室合作,彼此有一个非常深厚的信任基础。尽管搜狗的企业规模现在还不够大,但是在研究方向的选择,在题目的设定上,我们和清华是互补的。

EW:整个决策也蛮快的?你本人在这个项目里负责什么工作?

WXC:这个想法是很好的,但在决策方面用了一段时间。对一个初创的东西,概念最开始都是模糊的,我在签约前,也不能说清楚这个项目什么时间能产出,这是一个难题,甚至在最开始那会儿大家对人工智能的理解都不一致,但是AlphaGo之后所有人都懂了,人工智能就是未来。

研究院才刚开始,现在还在创建阶段。这个研究院我自己是兼任院长的,亲自带,花精力,真正把人工智能变成一件可以落地的事。这跟创业一样,是一步一步的概念。研究院前身是搜狗和清华的联合实验室,但是肯定会升级发展它,对我最大的挑战是结束惯性,让大家带着新的理念去做。

EW:国内人工智能技术的水平跟美国硅谷之间的差距大吗?

WXC:确实有差距。尤其是美国高校的研发实力特别强大。美国在这个领域能快速发展,就是因为背后有高校技术力量在不断推动。所以有人问我看好国内哪些人工智能的公司,我其实看一个简单的原则,它是否能够跟高校持续地产生联动,还是属于把技术拿来之后,跟高校就断了连接了。我只是强调跟高校联动,因为背后需要有更大的资金投入,企业可以投入,高校可以投入,这就属于发动机在里面,发动机不是小东西。

EW:李世石的事情之后,你曾说国内的人工智能缺乏浪漫主义。由你领导的搜狗在这方面会不会更浪漫一些,更天马行空一些?

WXC:我们一方面解决生存问题,一方面在这里面努力地做一些技术性的突破,我希望突破的东西有它浪漫的应用在。有些时候做理论突破,大家可能听不懂你在干嘛。我们希望在本职工作以外,做一些有突破并且好玩的东西。

EW:这些跟理想有关吗?

WXC:公司来讲是生意的事,但是大家开始要做有意义的事情,肯定是跟理想相关的。

EW:人工智能在搜狗未来的公司布局中会占到什么样的位置?

WXC:人工智能将是搜狗业务的核心。不管是输入法、搜索,未来都是要慢慢地用人工智能去武装它,才能够让它更好地帮人表达或更好地获取信息,就像以前提大数据、云计算技术时,搜索产品都是走在最前面的,在人工智能领域,搜索也一样会走在最前面。搜索公司的灵魂就是人工智能。

EW:刚刚过去的一年,你工作的重心是什么?管理维度多一点还是技术维度多一点,你的时间现在整体怎么分配?

WXC:我认为自己的核心工作是要给搜狗规划它的未来。我之前花了不少的时间在日常里面,在背后其实是建立一个共识,大家对于未来长成什么样的共识。而且这个共识,也需要依赖大量对搜狗现状的了解,从而量身打造它的未来。

EW:搜狗和知乎现在的合作情况怎么样?

WXC:知乎今年最大的特点是其爆发性的成长,这跟搜狗搜索技术的贡献是分不开的。我们为其提供了更好的技术,此外我们给知乎单独开辟搜索频道,将源源不断的流量导给知乎。原来知乎是一个小圈子,现在可以有更大的释放;当然这跟知乎自身的努力也分不开,但是搜狗是一个很重要的助推器。知乎成长得越大,对搜狗本身也是好事情。

EW:搜狗和知乎的合作现在到了什么阶段?

WXC:现在合作已经比较成熟,知乎已经接手并能够运营我们提供给他的这套搜索系统。搜狗和知乎互相理解和信任是做事情的基础。

EW:目前搜狗和微信团队的合作进展到什么程度?

WXC:搜狗和微信的合作还会有新的东西推出。我们一直在做一件事情,去搜索很多微信内容。现在正在做一种“三角关系”的打通――微信的很多内容,比如可能是医生写的,而这个医生在丁香园这个应用里是有标识的,所以通过丁香园的标识,我们知道微信上哪些内容在医疗行业是相对权威的。这样做,也能改进我们的明医搜索。   EW:面对移动互联网的环境,搜索引擎一度被视为在各个原生App各自封闭环境下显得无所作为,这个问题已经化解了吗?移动互联网环境下搜索相较于PC时代,有什么新特点?

WXC:世界是这样,久分必合,久合必分。最早是几大门户,没搜索啥事,随着互联网内容越来越多,搜索变得越来越重要,这是PC时代的情况。在移动时代之后,在App里面,一开始搜索是下降的,那指的也是传统的搜索――以关键词为核心的。我认为我们做到真的向人工智能引导,就像Siri这个东西一样,在新互联网环境中,可能又会回到中心位置去了。

EW:搜狗搜索在国内移动端的份额已经占到16.2%,你如何看待未来移动端的搜索格局,格局变化的主要推动力是什么?

WXC:搜索引擎格局变化分成两块来看,第一件事情是继续扩大差异化。以前来讲都是基于浏览器的搜索框去铺,这是之前的竞争。第二个阶段的竞争,会变得确实能给用户提供更好的服务、更好的体验。这方面又分为两个方向,一个是我们有不同的搜索内容,包括中间有社交网络,这是我们的优势,我们有社交的资源,我们跟其他企业去合作的时候,比较温和,所以能得到更多资源,比如知乎与搜狗的合作,这件事情让我们独有的力量能够释放出来。除了微信内容、知乎内容,我们还会继续开发新的东西,包括明医搜索,以及最近与微软必应合作推出的英文搜索与学术搜索。我要让用户看到不一样的东西,不一样的内容。而且这些不一样的内容,一定要代表未来的方向。

第二件事,搜索技术本身比较尖端,只有少数几家公司能玩得起来,只有你能干这个事情,那接下来退一步说,即使大家都掌握这个技术,格局也改变不大。也就是说基本格局已定。所以这是蛮苦的一件事情。但这是一个推动力,因此能做到真正未来技术上的突破,在人工智能领域里产生更大的颠覆性的力量,这也是我认为大家会去争夺的新战场。包括之前的Siri之父达格吉特罗斯(Dag Kittlaus)最近想推一个叫Viv的语音助手,就是搜索引擎下一代――它能听懂你的东西,能够直接给你答案,这是未来深度搜索的制高点。

EW:谷歌是当下搜索技术的最强者,与其相比搜狗有什么差异化的竞争优势?

WXC:第一个优势,我们更专注于解决中国本土的问题,而谷歌是一家全球性的公司,它要解决的问题有很多;第二,我认为我们现在跟微信、知乎等产品的合作,这些都是独有的资源,不是在技术层面,而是在内容层面上,我们的生态会更好,我们也更愿意找到合作的机会;第三,就是我们有输入法,输入法是我们的强势产品。输入法和搜索对用户而言,一个是表达,一个是获取信息,在表达的入口里面,我们未来有很大的优势。

EW:过去这一两年的智能手机大战,更多的互联网公司开始参与手机硬件市场,被称为抢占移动互联网时期的船票行为。你怎么看这种抢船票行为,搜狗需要这样的船票吗?

WXC:首先你得有大的用户基础,用户背后是某种核心力的体现。抢手机船票只是中间的一种路径。但如果你船装不了这么多人,最后不可能让十个公司都能在做手机这条路径上拿到船票,导致这十个公司都抢这个船票,可能最后反而上不了船。

搜狗有两个东西:一个是有搜索核心技术的积累,在国内是少有的已经搭建起来的庞大的技术团队,有的技术已经快发布了,我们会不断推出一些好玩的东西,同时我们有巨大的输入法用户规模。我觉得我们有用户规模,有技术的积累,这是我们自己的船票。

转载注明来源:https://www.xzbu.com/1/view-7499208.htm

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

人工智能 医疗信息 大数据 人脸识别 数据系统 数据源
0