邢波:AI 就像土木工程(AI as “Civil Engineering”)

2018年6月13日,由上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导,上海市长宁区青年联合会、亿欧公司联合主办,拼多多协办的“2018全球智能+新商业峰会”在上海长宁世贸展馆举办。

峰会以“AI落地,产业升级”为主题,现场聚集超过5000位AI行业内外人士,共同探讨AI目前面临哪些挑战,当下如何商业落地,未来将会怎样发展等问题。峰会采取“1+8”的组织架构,除了6月13日的“全球AI领袖峰会”外,14-15日将举办包括AI消费产品峰会、智能+新出行峰会、智能+大健康峰会、智能+新金融峰会、AI国际化峰会、智能+教育峰会、智能+新服务峰会、智能+零售峰会在内的8场垂直峰会。

在全球AI领袖峰会上,卡内基梅隆大学机器学习系副主任、Petuum创始人兼CEO邢波发表了《AI as “Civil Engineering”》的演讲。

邢波,人工智能,刑波,Michaed I. Jordan,机器学习,算法

邢波现场演讲实录

各位好,我这个PPT昨天刚写完,没有时间翻译成中文,我过去十几年一直从事人工智能和教学的工作,我既不是教父级的人物也不是企业高管,我的讲话没有那么高屋建瓴,更多从案例出发。

如何从一个基础工程的视角看人工智能这样一个题目,刚才Michaed I. Jordan教授提到了,问到什么是人工智能?人工智能现在基本上大家理解的是无人车,像机器人,或者是AlphaGo这样能够跟人类进行对抗的一个算法,或者是我们用来刷比分的这些刷脸或者是标注的工具,诸如此类。

这些东西给人的印象好像是,我们已经进入到新的时代了,好像有设备真正挑战人类的很多技能,甚至能够让人产生一种恐慌感。我把这类人工智能翻译成魔术师,能够给人魔幻的效果,也好像有一点效果。

刑波-人工智能1

但是细究它们的应用价值,或者是容易获得的成绩,其实现在还有很多问题。比如说这里有一个图表是麦肯锡最近做的一个访问,觉得人工智能在你的公司里面应用到了什么地步?当然这里面指的公司不仅仅是互联网公司,其实互联网只是世界和生活里面的很小一部分,我们还有水电公司,还有农业、制造业、交通、运输公司等等,这些公司都算上的话,发现大部分的老板们觉得39%的人工智能获得了很好的应用,但是大部分老板对它们的应用或者对它们的存在不抱非常正面的判断。

这里面的原因很多,其中包括了我们常听到的AI人才缺乏,技术的不可企及度,这些原因归根在一起,无外乎两点。如果不是像腾讯、阿里或者百度这样的公司拥有大量人工智能高级人才,我没有办法在我的公司内部去建设一个人工智能的设备或者是一个能力。这里面包括了设备,包括人,包括技术,包括各种各样专业人才的缺乏。

同时,你自己建不了的话也没有地方去买,我们刚才看到了AlphaGo,或者是我们在各种公司看到的推荐系统,能够说我花一笔钱买到公司来做一些类似的应用吗?其实不是。它的产生和搭建的话,不是一种以工业产品为目标和规划的这么一种方式,实际上是在公司内部的一种综合能力,包含了很多独门秘籍,包括很多专家的贡献。

它们产生的能力和设备是非商品的,其实有点像工艺品。这样的现实,使得人工智能没有突破它的原始技术密集型的形态,并没有产生一个真正靠谱的功能。说一句不客气的话,实际上有很多在外面大为展示,甚至高调展示的人工智能技术,背后包含了很多不可靠性。

在这样的情况下,我们要问,如何能够去连接这个人工智能的现实和大量对数据的处理,或者是自动运作这种方面的需要。

我想提出另外一个观点,我们作为一个建筑师或者是一个普通的基础设施建设工人的这么一个需要,你要知道我们谈论土木工程,谈论电力,甚至谈论像计算机数据库的时候,我们想到的不是魔幻或者非常炫酷的一些功能,我们想到的是一个非常非常基础的,几乎是感觉不到的存在。

这些工程师,这些工人既不是物理学家也不是力学家,也不是计算机学家,他们还是可以把楼建起来,也可以把电力调动起来,可以把计算机数据库运转起来,我的意思是,这个技术已经退居到非常后延的位置,而它的大规模使用和可重复性,高效性和低价性产生了,使它们能够让人非常普遍地使用它。

而且它们使用标准跟我们在人工智能见到的不一样,首先它有通用性,可以在各个行业里面产生影响,比如我们在做数据库,这个数据库叫Ovcal,同一个产品可以用到不同的地方。产品的稳定性上面,有非常强的鲁棒性(亿欧注:音译),可以做诊断,可以做修理,可以做升级,这些功能在我们人工智能里面很少被谈论到,虽然看上去很土,或者很不太让人瞩目,其实它是一个学科或者技术演化到生产力或者一项工程学科的基础,人工智能现在缺乏的不是算法或者一些数学的知识,其实更缺乏的是把它作为一个工程领域,工程手段的思维方式和中间的很多规则。

比如说,我们能不能把人工智能打造成不同的构建,像螺丝和螺母一样能够重复使用,它能够有标准化,可以在不同的地方即插即用,或者能够全面覆盖不同的需要,这些东西其实现在在人工智能所提供的功能或者是对人工智能的研发人员来说,还没有产生很强烈的共鸣,大家基本上还是处在闭门造车阶段,说话刷比分这么一个心态里面。我觉得思想的转变,有可能是我们现在面临的一个挑战。

我这里讲一下我本人在过去几年的科研和实践过程中所体会到、所需要的一些思维方式和一些技巧,如何把人工智能作为一个科学推动到更加工程化的范畴里去?

首先,我们需要第一性原则。这里面包括了各种各样的数学原理、算法,还有很多专门的专业知识。但如何来归纳和如何来实现,或者如何解释这些知识的话,其实是有很多门道在里面。

比如说像现在很多深度学习的算法,像一个黑板的公式,最后产生了有意思的结果,但是很难搞清楚中间的因果关系,所以当结果是好的时候,大家非常高兴。但是如果我一旦出了一个事故,这里面去反推这个诊断,或者找原因,是很困难的一个过程。

所以在比较成熟的一个工程师眼里面,我认为哪怕是在第一性原则理论基础上的话也要有标准化的一种思维方式,就是把我们用的模型,我们的算法用一个比较系统的方法做归纳,比如让这块的损失方程,各种各样的结构,各种各样的约束,各种各样的算法分门别类有一个唯一实现的方法,而不是产生了几百种不同的实现,这就是一个产品的制作由靠一个工人自由发挥转化为严格的生产线,这样的人造不同东西的时候,可以产生不同的结果。

第二步,实现了第一性,产生了构建科学理论指导以后,还要变成一个可以使用的,可以部署的零件。像在工程里面有螺丝和螺母一样,这些零件自然会覆盖到人工智能所有的领域,而且不是纯算法的覆盖,从原始数据一开始的时候,就要开始考虑用什么样的处理方式或是各种各样的手段来把这个原始数据整合到一个能够使用各种机器算法的模式。

然后,得有一个机器学习的方法库,也是一个标准化和一个通用的库来做进一步的学习或者是训练。最后系统也要有主要的匹配,使算法在同一台机器上开发出来,可以在其他设备上部署。

现在我们在实际的操作过程中,这些认知和这些行规还没有实现,所以我们觉得还是有很多潜力可以去推动这个事业的。这就是一个例子,把不同的零件组建做一个标准化的归类,来分布生产,最后做总装或者是做调试。

最后,我个人认为,人工智能哪怕是复杂工程的实现方法,它不是一个堆砌式或者工艺性手工作坊样的做法,像做土木工程一样的拼装或者累积的方法,可以把不同的模块根据需要做不同的组合,来达到一个好的综合功能。

最后很重要的一点是说,实现的功能都有可解释性,也有不同层面上的解释方法。比如模型、数学原理需要被解释通,这还不够。同时还要告诉别人,让用户知道数据是如何被处理的,系统是怎么被调试的,中间的这些推导或者推荐是动用哪些资源,或者哪些模型的元素。

这些东西现在还处在非常混沌的状态,所以我们的人工智能,还处在相当原始,类似于炼金术这样的阶段,把所有的东西混在一起,最后出来一个相当好的结果,很难解释或者重复这样的结果。

我本人的工作,或者我认为这个领域的话还是需要有这样的一种思想准备,能够看到以后的人工智能研究和工程,会有一些方法论上,或者是风格上的一些变化。

结合我刚才讲的这些主要的感想,我讲一下我现在这个公司Petuum在这方面的实践,Petuum就是这样的一个技术平台,它主要的设计思想就是对于人工智能的算法,数据处理模型、流程,或者是系统框架做了一个高度模块化和标准化的定义和设计,然后分步实现,使它能够支持不同的应用。

比如最近我们会推出一个医疗方面的应用,它上面覆盖了从医疗图像的标注和解读,到病历解读,到药物推荐到医疗代码自写生成,一套很广泛的功能。

同时,同一样组建可以在另外一个供应链形成影响,比如在制造业使用IOT物联网设备的讯号里面,包括设备的运营,设备的检测,或者是故障预测方面,其实它虽然在表面上看上去问题不一样,但是运算的本质和最后计算机基础的设施跟医疗实际上有共同之处,我们可以重复使用很多组建,在很快时间内达到完全不同领域的部署。

而这种标准化的实现,并不是以牺牲算法的功能或者性能为代价的,比如这个展示,我们最近要发布医疗方面的软件包,它覆盖了很多在医院里面跟医生流程相匹配或者互补性的功能,实现的精度和优良度虽然通过一个组件的方法很快实现,其实我们做整个这套设备,大概两三个工程师花了三四个月的时间,整个精度基本上超越了所有业界里面发表的正式成果。

我觉得这个路子是很有希望的,需要一开始的投入去设计这种标准,去产生这种可通用性的组件,当一开始把技术的学费先付掉的话,以后的发展中有很大的回报,使价格和费用降低方面能够产生巨大的影响。

刑波-人工智能2

我最后做结束总结的一个愿景,我希望人工智能能够被当成一个像土木工程一样的非常非常朴实的领域对待,而不是艺术品一样非常炫酷的这么一个功能或者技术来对待。所以它的实现方法是符合工业流程,符合工程标准,可以被重复,可以被理解的这么一个方法。它通过组件的堆积或者预言、预制造,基本上大部分实现满足大部分应用功能,通过制造人员或者建设人员的一些有限的,而且是很有价值的努力,能够一起汇合到对每一个应用专门化的产品里面去,这是我个人希望跟大家分享的一个人工智能以后可能的发展方向。

谢谢大家!

相关领域
商业