首页 首页 人工智能 查看内容

第四范式蔡斯扬:感知+决策成趋势 需要突破行业三大瓶颈

木马童年 2019-8-15 13:45 107 0

我们正在进入数据服务时代,预计到明年每人每一秒产生的数据将超过1.7 MB,未来的世界将是一个以数据为中心的世界。那么我们如何以数据为中心推动产业变革?人工智能的应用走到今天又呈现出什么特征?在日前举行的英 ...

第四范式蔡斯扬:感知+决策成趋势 需要突破行业三大瓶颈

我们正在进入数据服务时代,预计到明年每人每一秒产生的数据将超过1.7 MB,未来的世界将是一个以数据为中心的世界。那么我们如何以数据为中心推动产业变革?人工智能的应用走到今天又呈现出什么特征?在日前举行的英特尔至强平台的用户分享会上,第四范式(北京)技术有限公司硬件业务部门总经理蔡斯扬表示,人工智能应用发展到今天正在呈现出“感知+决策”的特征,在这样的特征之下,底层的硬件与软件与应用的融合方式与协作方式正在发生变化。

第四范式是一家人工智能的独角兽公司。蔡斯扬出场首先介绍了公司名字的由来,人类对于科学的探索经历了实验科学范式、理论科学范式、计算科学范式和数据科学范式,第四范式即数据科学范式的本质上是让计算机从海量的数据当中发现规律,形成理论,诠释自然现象。而该公司之所以将这个名字用作公司名字是希望将数据科学与人工智能结合,推动产业变革。

据蔡斯扬透露,目前在第四范式公司中有60%是AI相关的技术人员,在公司成立的四年多里,这家公司与7000多家客户在中国落地了上万个AI场景,获得了五大国有银行的投资。目前公司在AutoML(自动机器学习)和通用人工智能平台方面处于国内甚至全球领先的位置,比如第四范式的AutoML、AutoCV等自动机器学习算法,与一些国际上比较领先的云服务企业相比,能够实现效果成倍的提升。

谈及与其他AI创业公司不一样的地方,蔡斯扬认为,一是第四范式做通用人工智能平台。因为做通用人工智能平台,所以要构建从最底层的算力,包括基础架构层到AI核心引擎(存储引擎、计算引擎、推理引擎)以及往上的AI功能的能力,第四范式希望打造一个AI操作系统,让客户更容易在这个系统上实现AI应用落地。二是提供垂直场景下大的应用技术,比如决策类、感知类和语音语义类技术,从而提供覆盖更加复杂的场景的“感知+决策”技术服务。

蔡斯扬进一步表示,目前AI正在朝着“感知+决策”的方向发展,在这样的背景下,对从底层到上层的技术也提出了相应的挑战并呈现出一些新的发展态势。

从挑战来看,计算力瓶颈是其中之一。目前业界普遍采用X86架构,基于冯·诺伊曼计算机体系,然而现有的计算体系的访存机制正在制约计算力的未来发展。第四范式希望通过三个方向入手,对整个冯·诺伊曼体系和机器的算力瓶颈问题进行一个突破性的创新尝试。

解决计算力瓶颈,类脑计算等新计算架构是一个路径,但这需要时间,目前类脑计算尚未成熟,另外一个路径是基于“算法定义计算”。蔡斯扬表示,未来五年产业将会进入到异构计算的黄金时代,目前我们看到的GPU、 NPU、ASIC、FPGA等多样芯片正越来越多地被运用在AI领域,这背后原因就是不同的算法在不同的芯片上有不一样的表现,当算法的逻辑与芯片计算的逻辑相互匹配度高,效率就会更好,所以通过协处理计算能够打破目前性能提升的瓶颈,大幅提升效率。比如第四范式的SageOne软硬一体系统是从SkyLake升级到最新的Cascade Lake,整个综合性能提升了4-8倍。

瓶颈之二是数据。蔡斯扬表示,很多客户在进行数字化转型和AI转型当中最大的瓶颈是没有数据,数据在哪、如何收集、收集之后如何让机器能看懂、如何在AI训练和推理中快速使用、调用数据。“一个优化方向是利用存储引擎,建立一个类似于企业数据中台的核心设备,来进行离线数据与在线数据的管理,这个存储引擎与传统的数据管理不一样,它是以事件和特征为数据管理的核心,这样机器能够读懂特征,因为我们训练机器时就是让机器能看懂特征,能够更好地分析和预测未来的事情。”蔡斯扬认为,与此同时,还需要进行统一的AI数据治理,把历史的批量数据和线上的流式数据进行同步,这样整个系统才不会在建模当中出现数据不同步导致的运行准确性的问题。未来的数据存储技术将会发生很多变化。

瓶颈三是网络。大家往往觉得这和AI没什么关系,但是蔡斯扬透露,第四范式做SageOne时花了很长时间来优化网络,因为在整个机器学习的过程当中, I/O的交互以及分布式机器学习中跨节点通讯压力非常大,所以在SageOne体系里,网络优化起到了至关重要的作用。第四范式自主研发了PRPC网络协议用于分布式训练,来解决机器学习分布式训练中的网络瓶颈。蔡斯扬进一步透露,目前很多互联网客户做AI都采用单机跑训练,原因就是采用分布式增加5个节点的时候,可能还不如单机跑得快,这其中就是网络通信协议的问题。

目前,各行业企业都面临AI转型的机遇和挑战,第四范式建议客户AI转型采用“1+N”战略:“1”是结合公司核心业务,把1个或几个对业务影响最大的场景做到极致;“N”是用最高的效率规模化落地尽可能多的应用场景,使场景的总体价值最大化。“1+N转型战略背后需要一个强大的AI中间件的平台,利用AI中间件来把其中各种的复杂问题解决掉,这就是第四范式要去做AI平台的原因。蔡斯扬表示,要做这个AI中间件,其中涉及到底层算力与AI技术架构、工具、模型等,而要实现多方位的整合创新,它需要第四范式与英特尔进行各个层面的紧密合作,这也是为什么第四范式要与英特尔合作的原因。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据服务 人工智能 英特尔 人工智能应用 计算科学 数据科学
0