清华大学教授孙富春：《人工智能与产业腾飞》

2017年10月12日，第七届中国智能产业高峰论坛在佛山开幕。

在第一天的主论坛上，中国人工智能学会认识系统与信息处理专业委员会主任，清华大学教授孙富春发表了主题为《人工智能与产业腾飞》的精彩演讲。

孙富春教授深入浅出地回顾了人工智能的前世今生，并从产业的角度介绍了人工智能与现有产业如何深度融合，实现产业链条的形成以及制造业的腾飞。在报告中还为与会嘉宾展示了其团队的科研课题和科研成果，并对人工智能的未来进行了思考和畅想。他提出，我们应构筑我国人工智能发展的先发优势，加速产业建设，加快迈向“中国制造2025”。

孙富春,人工智能,机器学习,芯片,机器人,数据

【孙富春教授现场演讲实录】

尊敬的各位嘉宾、各位同仁、大家上午好！我首先非常感谢学会给我跟大家交流的机会，我汇报的题目是《人工智能与产业腾飞》。

谈到人工智能我们不能不提到图灵，图灵在1950年在《计算机能思维吗》提出了著名的图灵测试，就是人和机器背靠背，让人提问题，机器回答，如果有30%的机器回答让人感觉到是像人回答的，我们就说这个机器具有智能，他建立了人工智能的思想基础。我们经常讲是计算技术推动了人工智能的发展，用哪些计算呢？首先是云片计算机，是它主要推动了现代人工智能的发展。还有哪些计算呢？网络计算、互联网技术推动了群体智能的发展。还有生物计算，以生物计算主导的人工智能，一定是未来人工智能发展的重要方向。我觉得现有的智能是沿着这三条线索分别在发展，同时部分有交叉，但是以独立的发展为主。

我们过去讲人工智能有两大范式，一个是符号主义，就是利用数学里的数理逻辑，通常称它为知识驱动的人工智能。第二部分我们讲是联接主义，就是神经元，一直到现在的深度学习，称为数据驱动的人工智能。人工智能的第三范式是什么呢？我们认为是神经机制驱动的人工智能，包括今天李院士讲到的深度学习，最早是1958年，人们对猫视觉皮层的发现而建立起来了。今天的超限学习机，包括强化学习都是基于脑科学和生物学的发现，他们就是基于神经机制驱动的脑认知。

人工智能有很多的领域，我们觉得这段时间发展比较多的应该是机器学习和机器感知，机器感知包括语音处理技术、图象识别技术等等。目前人工智能已经应用在自然语言处理、知识表达、自动推理、机器学习、计算机视觉和机器人。人工智能时代人和机器之间应该是一个双向的关系，机器有感知和决策能力，有认知能力，可以跟我们一起工作，协同完成某项任务，我们今天讲到的人机混和智能就属于这个方面。最近有一本书，是王飞跃老师的学生王晓翻译的，我还为该书写了一个序，就讲到了社会机器问题，这是一个新的社会生态，人和机器共存的社会。

我们再谈深度学习，深度学习是1958年约翰霍普金斯大学的David Hubel和Torsten Wiesel教授一个重要的发现，他们发现了人的视觉信息处理是分级的，这个发现大大促进了人工智能的发展。

我们说深度学习是一个端到端的学习，它跟我们传统的模式识别有什么不同呢？就是自动选择特征。深度学习的产品现在应用在移动终端里面，像苹果的Siri，微软的智能安全工作空间。问一下什么是“深度学习”，只要同手机说一下，SIRI马上会告诉你强化学习的意思。强化学习刚才我们李院士讲的比较多，我这里就不再多说了。

我们看到阿尔法狗把所有围棋高手都打败了，那么大家会产生一个映像，人工智能将来不得了。但我认为以深度学习为代表的人工智能存在这么一些缺陷，第一个是端到端黑盒子，网络中存在大量的复杂非线性变换和大规模神经元连接，少量的随机扰动就会导致最后结果的剧烈变化，其行为和表现难以理解和合理解释，很难对模型的行为进行有效分析，无法找到原因并进行修正。

我们提出这样一个观点，我们认为在深度学习的之前的模式识别是算法加特征，这些特征是人自己选定的，比如说颜色特征，纹理特征，几何特征等等，数据加进来干什么？数据加进来就是供自动提取特征。我们再看，现在的深度学习只用到了算法和数据，其实人在观察事物的过程里面还用了一个很重要的东西，就是模式。深度学习这两年有了很大的进展，一个重要的因素就是视觉、听觉、触觉，脑电都可以用二元矩阵表示，深度学习可以推广到这些领域。人在观测事物时，观测模式不一样，白天大多用到视觉，操作物体用触觉，有时把这几个感知信息融合在一起。好，我们再看看行为。行为是人工智能一个非常重要的部分，但是现在的深度学习没有做到这一点。我们再向上看，我们研究了特征，我们需要什么？概念，这就是可解释性的问题。此外，我们还需要知识和模型。我们看看现在的深度学习仅仅做到了我画的这一小块，而且还不够完善。

刚才强调一个很重要的问题，需要很多数据，如果没那么多怎么办？就是小样本表示学习是目前非常重要的一个风向，怎么做呢？我需要大量的数据，这实际上是一个正则化的问题，我们通过正则化，通过流形学习可以改变这个问题。还有一个问题很重要，就是如何产生数据。学自动化的人都知道，模型可以产生数据，如果将模型的产生式方法和机器学习的判别式方法结合，有望解决数据的产生问题。这就是今天强调的对抗式学习，它是把产生式方法和鉴别式方法结合在一起，通过竞争产生新数据，这是目前小样本学习里面非常重要的一个方向。

符号概念，关联网络的概念这是今年谷歌Deepmind公司提出来的，它直接通过这样一个网络，通过概念的组合来形成从感知到概念的转化。这种新的符号-概念关联网络，实际上打破了纯粹模拟人脑神经网络生物构造的计算方式，从模拟人的“组合性”思想中另辟蹊径，从而取得了对抽象概念这一特定问题的进展。

图像理解最近大家做的比较多，这是我一个博士生在做的工作，从任意给定的图像，可以学习图像的自然语义理解，实现了从单一目标的概念，到整体句子结构，最终实现图像理解的过程，这是一个对图像更深层次的理解过程。我们可喜的看到在今年温哥华的IROS会上面，李飞飞也报告了怎样从感知形成理解，这就是刚才讲到的从特征到概念。

生物计算怎么样？存储量大、运算快，能耗特别低，DNA计算是普通电脑的十亿分之一；存贮量大，1立方米的DNA溶液，可以存贮1万亿亿的二进制数据。运算快，十几个小时的DNA计算，相当于所有电脑问世以来的总运算量。我们再看看量子计算机，这个是今年的中国科学技术大学发布的量子计算机原形样机，一台操纵50个微观粒子的量子计算机，对特定问题的处理能力可超过目前最快的“神威·太湖之光”超级计算机。加拿大神经外科医生Wilder Penfield的实验结果说明大脑对感知数据的记忆是全息的（即包含我们生活的所有细节），而并不是单纯的一幅图像、一种声音或一种感觉，即使是对通常的事件。我认为未来的人工智能一定是这样一个图谱，从下面的硅云计算到生物计算（或者叫碳计算），最后到神经机制驱动下的强人工智能。这里我提出的观念可能跟许多人不一致，可以讨论。

人工智能的产业在中国现在是不断的兴起和发展，中国人工智能产业的规模2016年达到了100亿元，增长率达到了43.3%，2019年我们国家达到了344亿人民币。中国跟美国的差距我们看一下，从人工智能的企业数来看，我们大概有两年的差距，但是从投融资角度来讲我们差距还比较大，2017年美国是978亿，中国是635亿。我们再看看中美在人工智能各个领域，像自然语言理解、机器学习应用、计算机视觉和图像、技术平台，无人机等等，这方面我们跟美国还是有一定差距，尤其在自然语言理解、机器学习这方面我们差距比较大，我们国家在2016年的专利增长非常快，人工智能目前用在哪些地方呢？医疗、汽车、消费电子、电商、安防等等。

这是一个未来十年我们可以展望的，从现阶段的大数据、感知、理解、机器人、自动驾驶里面，近期的主要是互联网的应用、电商、商业流程的自动化、摄像头、视觉语音语言手势的应用、工业机器人等，未来3—5年可以看到辅助自动驾驶、商业机器人、VR和AR技术，分布式传感器技术将在中国的产业方面有大的发展，包括人工智能+计算构架、算法框架加传感平台；未来5—10年，自然语言理解成为我们万能的助手，甚至请一个外国人讲课，你们听到的是按他的语调的中国话。我们可以展望的未来十年可以达到全天候、全工况的无人驾驶。

人工智能在各个行业处于爆发状态，像芯片、智能机器人，智能社交、智能交互和智能教育，下面我们来看一看。

人工智能芯片主要包括GPU、PGA等等，人工智能时代的“晶体管”横空出世。英伟达是深度学习芯片的龙头跨国公司，我们沈总在这儿，英伟达推出深度学习芯片，Tesla P100能够实现数百CPU服务器节点性能，数据处理速度是NVIDIA此前Maxwell架构显卡系列的12倍。

机器人是人工智能产业的一个非常重要的支柱，未来十年里要大力发展机器人，它包括了执行、装置、控制、感知系统等等，其实我今年参加了《国家机器人发展报告》的撰写，明显感觉到我们国家在一些传统弱项方面进步仍然不是很大，包括像减速器、高密度高精度的电机、驱动系统，还包括一些分布式传感器。这是我国研发的仿人机器人，这是京东做的物流机器人。我们国家现在已经形成了门类比较齐全的机器人研发基地，从东北一直到我们广州。

我们讲讲未来发展，人工智能的发展已经从弱人工智能到了以大数据和深度学习为主的弱人工智能，最后到神经机制驱动下的强人工智能。我个人认为，人工智能将来最大的产业是算法加软件和数据；第二是芯片，第三是智能教育，第四是共享平台。将来你家的冰箱，电视机都是共享的，你将来从广州搬到北京去什么都不用带，一切独有共享公司负责。另外还有产业服务，典型代表就是百度的天智系统。

谢谢大家！