搜狗CEO王小川：人工智能技术与应用思考

2017年5月26日，由爱佑慈善基金会与福布斯中国联合主办的“慈善+”2017跨界公益论坛在北京顺利举行。

论坛上，搜狗公司CEO王小川发表了题为《人工智能技术与应用思考》的演讲。

他认为，慈善是在解决人与人之间、人与社会之间的冲突。人工智能的出现，更可能的是为人类提供帮助，通过技术帮人类解决基础问题，帮助传统产业升级，帮助人与机器更好地交互，从而产生更大的价值。人工智能可以超越人类本身的力量，极大地提升社会的效率，让社会更加和谐。为了更好地迎接人工智能时代的到来，互联网从业者应该充分了解人工智能到底是什么，并用人工智能技术去完善产品，造福更多人。

【王小川现场演讲实录】

说到慈善，我想，慈善是在解决人和社会之间的冲突。社会这么大，里面有弱势群体，有企业家，有各种资源，怎么进行分配，能够使每个人都得到关怀？

这种冲突，停留在人和人之间，未来已来，人工智能来了以后，引入更多的是冲突？还是帮助？人工智能到底是一种工具，能让我们的社会更加和睦，让我们的企业家也好，弱势群体也好，得到增强？还是会摧毁人类，将人类颠覆？

其实在之前的一年，有很多朋友都在关心这样一个问题，甚至关乎伦理，那就是有了技术之后，也许少数人变得更加强大了，使得更多的人没有生存的能力，沦落为更加弱势的群体，或者是没有价值的群体，甚至引发更多伦理方面的问题。

一辆无人驾驶的汽车，当它开动起来之后，更多的是在保护司机，还是在保护路人？有这种冲突的时候怎么解决？如果冲突不可避免，是保护车前的儿童，还是老人？这里面有很多我们要去思考的问题，不管是从伦理上、经济上，还是从技术上。

在这里我跟大家分享一些有关人工智能技术和应用的思考，更多的是希望大家对人工智能有真切的感觉，知道它跟我们的关系。

这几天大家都在关心一场比赛，AlphaGo2.0来了，去年3月8号的第一场比赛，给我们带来了巨大的冲击，我们呼唤人工智能时代的到来，AlphaGo成为一项启蒙运动，让我们认可机器在某些领域里面比人做得更好。

事实上在这个比赛之前，我跟一些医生聊，以后如果机器来了，机器能帮你诊断病人，或者能够去做手术，你怎么看？医生跟我讲，不可能，人的事情，机器做不了。但是比赛之后，我再跟他聊的时候，他们开始相信，未来机器在诊断或手术领域，有可能会超过人，这是一个巨大的变化。

围棋比赛刚开始的时候，即便机器走出一些招数，聂卫平也好，其他的九段选手也好，都会说这个机器走了一步臭棋，认为机器是不懂围棋的。当比赛进行到后面几场，媒体报道发生了中盘逆转。前面都认为机器下得不好，可后来机器却赢了，怎么解释？我们必须要接受它，接受机器中盘逆转了，甚至后来他们对AlphaGo的称呼都改了，他们把AlphaGo叫“阿老师”，承认它是老师的角色。今天的围棋也是，如果有了AlphaGo，我们能让围棋走得更好，这会产生巨大的心理冲击。

去年第一场比赛结束之后，中国围棋队总教练俞斌在新浪做直播，离场的时候，新浪的编辑跟我说，他处于一种崩溃的状态，已经不知道怎么招呼出租车，不知道怎么上车了。

今年第二场比赛的时候声音就已经一边倒了，大家认为人是一点儿取胜机会也没有了，事实也确实如此，前两场机器轻松战胜了柯洁，拿到了两分，这几天还在进行第三、第四场的比赛。

国富论的启示

回归我们的问题，人工智能到底带来了什么？咱们先不谈技术，而是谈基础认知，关于财富积累。亚当斯密在《国富论》开篇就提到，财富积累来自于社会分工和效率的提升。费孝通也提到，人口变多之后，才有机会带来更好的分工。互联网和人工智能时代有两个大的区别，互联网时代，按照我们现在的理解，上半场已经结束了，我甚至认为互联网时代已经结束，迎来人工智能时代。

这两者有什么区别呢？在互联网时代里强调的词是连接，连接使得在一个村庄，一个城市，甚至一个地球里的人，都能更好地进行信息的沟通。我来讲一个《圣经》里的故事，人很高傲，他们同心协力想修筑通天塔。上帝觉得人类是在藐视他的权威，便使他们说不同语言，于是每个人之前无法沟通，因此修塔之事就此搁置。

我拿这个寓言来讲互联网时代带来的意义，有了网络连接之后，伴随着信息的通畅，使得人跟人、人跟信息、人跟商品之间都建立了充分的连接，在此基础上，我们能够做到更好的社会分工，使得一万人、十万人，甚至十亿人各司其职，效率得到大幅度的提升，这是互联网在社会分工里带来效率提升的根源，从而创造社会财富。

到了人工智能时代有什么变化呢？因为这种连接已经无处不在，从3G、4G、5G，讲到了移动互联网、物联网，连接已经打开了。在这种环境里面，如果效率得到进一步提升，已经不是简单的靠社会分工能做到的了，而是利用人工智能技术，使机器取代部分工作，使机器在商业智能里面提升效率。

右边我讲的地方画了一个人的学习曲线，人若想自己变得更有经验、分工变得更专业，是需要时间的，社会分工的意义使得一个人能专心去做一件事情，从而达到效率的提升。我们可以看到，但凡引入了深度学习这样的模式，在一些特定的领域里，机器的学习速度比人快得多。下面这条曲线是人的学习速度，上面的曲线，只要有数据，机器在一天、一周、一个月里面就能够到达特别高的效率，在这个工作方面取代人，在这个社会分工下创造更高的效率。

从互联网时代到人工智能时代，前者是通过连接促进社会分工，提升人的效率，而后者是在社会分工已经形成的情况下，让机器参与其中，从而提升整个专业性的效率，这是这个时代新的脉络。

人工智能的四个阶段

今天除了讲一下人工智能的含义外，我还要讲一下人工智能技术究竟发展到什么样的高度，我们能怎么用？从上世纪60年代到今天，我列出了人工智能的四个阶段。

第一步是60年代到80年代，在这个时代里面，我们已经畅想计算机带来人工智能。当时是怎么做的呢？其实机器本身的能力并不够，得靠我们的专家把自己的知识告诉计算机，写成一种规则，让计算机在规则里面做搜索工作，最后产生智能的结果。在我心中，最简单的智能机器是什么？

大家都用过的一个东西，电饭锅，这是一种智能机器，因为研发人员能够告诉机器一个知识，每到103度就跳闸，否则饭就烧糊了。这是把人的知识教给了机器，机器去执行命令。或者是把医疗指南教给机器，让机器产生搜索能力，这是上世纪80年代之前的做法。很不幸，这种做法失败了，原因是人在总结知识，把知识教给计算机的过程当中，存在很多缺陷。因为人的知识并不一定足够多，而且很难表达给机器。所以80年代人工智能进入低迷期。

80年代之后又有了一些新的做法，人们不告诉机器知识，而是告诉它特征，我们做汉字识别，语音识别，人脸识别的时候，试图靠人去发现这些图片、语音中间的部分规律，找到一些特征。做汉字识别的时候，告诉机器一共有多少笔划是一个特征，横和竖是一个特征，再告诉它，哪个汉字的图像对应这个文字。这时机器在人的指引下，能够应用学习方法去学习对一个特征到答案之间的匹配。这个过程中间又给人带来了希望，又经过一波的发展，使人工智能接近实用。但到2000年又失败了。

怎么失败的呢？人在总结特征的时候，也会有困难。我们想识别一个人脸，王兵的人脸长什么样？脸瘦，很英俊，戴眼镜，鼻子高，就是他吗？人不是这样的，人是靠感觉的，这种感觉在特征的方式里是没法来表达的，用特征也很难描述对一张图像、一段语音、一个事物完整的表达，所以又失败了。

这种现状一直到2000年之后才发生改变。2006年有一篇论文，讲我们不要再尝试靠人去寻找事物之间的规律和特征，而是把原始的数据交给机器，让机器自己在里面发现特征，在里面做计算，付出的代价是一定得给机器更多的样本、更高的计算力。于是，从2000年开始产生爆发性的增长。我们发现机器比人在识别图像，识别语音领域更强大。包括像AlphaGo这样的机器，也是应用了这种方法，把围棋当成图像来进行识别。

今天这个方法的成功，大大解放了专业技术人员。2000年之前，当我们要把知识教给机器，把特征教给机器的时候，要求我们的技术人员对于行业具备充分的了解，如果搞医疗的，就得对心脏病有认知，对图像有理解，所以对跨界的人才要求就非常高。但是到今天，只要给到数据，这种数据可能不是工程师生产的，他只要具备处理数据的能力，就能够把人工智能实现。所以我们常开玩笑，第一波被取代的人其实不是所谓的专业人士，而是有专业知识背景的工程师。

拿Google举例子，他们之前做翻译的时候，翻译工程师是要懂得语言学的，懂得怎么用统计方法处理语言。但当有了深度学习以后，就不需要这些工程师有语言背景了，只需要把英语、中文的语料库数据拿到，就可以对语言进行处理，反而使得技术人员的门槛大大降低。所以这个行业为什么有机会做成功呢？因为两个行业可以融合了，有传统领域经验和知识的行业，只要跟技术结合在一块儿，就能带来效率的提升。

第四个阶段，我们已经看到曙光，前面三个阶段还是要求人的知识，人的经验，或者是人构造的数据送给计算机去学习，AlphaGo在第一版本的时候用了三千万局的棋，而另一种方法是给机器定一个目标，告诉它要赢这盘棋，但不是用人的数据训练，而是两台机器之间互相比赛，一台机器输了，另一台机器赢了，就能训练赢的机器掌握更多训练的方法，以此做提升。

这场比赛之前我做了一个预言，可以完全不用人的数据训练，两个机器之间PK就能够训练出一个AlphaGo来。但很不幸的是，我的预言失败了，在这场比赛当中，虽然两个机器PK的权重已经大大提升了，但还是用了人的数据，今天的人工智能还不能脱离人，或者是历史的经验数据，依然靠数据驱动，没有完全达到让机器自由发挥的状态。比如说我们做医疗，就必须要求医生将历史数据带给机器，而不是机器自身产生真正的智能。

人工智能的三个产品类型

另外再看，人工智能的三种类型的产品，在传统的领域里面，我们说机器有感知智能、认知智能。我们分三个维度、分成不同的目标来看，人工智能能做什么？

第一件事情，做识别。语音识别、图像识别。比如说我们在安防、在大的征信体系里面识别人脸，已经到达很高的品质，或者是在语言的语音识别里面已经做得很好，这是机器能做的第一件事。

第二件事情，做决策。就像AlphaGo下棋一样，你给它一个初始条件，它会告诉你接下来应该怎么走；你给它一个人的背景，它会告诉你是否该给这个人放贷款；你给它股票的历史信息，它会告诉你该买该卖。

第三件事情，合成图像，合成语音。一幅画，机器能给画上色，能把黑白照片变成彩色照片。从这个维度来讲，但凡我们今天看到一篇论文，或者是一个行业突破，我们都可以分到这三类里面去，机器到底干的是识别的事情，决策的事情，还是生成的事情。

对于商业来说，最重要的事情是机器做决策，它们的效率比人更高，识别和生成更多带来的是人机互动，是改善人怎么去控制机器，以前是靠敲键盘的方式，靠鼠标的方式，以后可能会产生一个虚拟的形象，能用更自然的方法跟大家交流，这是机器如今能干的三件事情。

人工智能会取代哪些职业？

我们可以看到，有一些职业很容易被取代了，有些职业很难。从去年到今年，这个逻辑到现在没有变化，这两年人工智能虽然在算法上有很大提升，但并没有产生更大的突破。容易被取代的是工作环境封闭，目标清晰的工作，比如说某些医生的工作，如果他只是简单地看片子，告知病人患有什么疾病；或者是下棋，下棋的信息只来源于棋盘，不受棋盘之外任何信息的干扰；或者是审计报告工作；或者是开车，在封闭式道路里打方向盘……在这些领域里面，只要是封闭路径，需要做决策，机器就可以把人取代掉，或者是辅助人，人只做少量的决策，把更多的决策交给机器。剩下的工作难点是什么呢？是开放的。

我们知道，要写一篇好的文章，需要行万里路，读万卷书，在这种没有套路的环境里，我可以负责任地讲，以今天的机器人是做不到的。在绘画、创作这些领域里，机器做得好很多。前两天微软小冰写了一本书，根据图片写诗，还发了诗集，这是做创作，但是这种创作其实只是套路的结果，拿历史的数据和图像做训练，不能创造出在原有的数据规格之外的新诗。所以这种创作，只在几千个字里打转，写不出一本小说，或者产生新的故事。

传统产业的升级

有人讲AI在什么领域最好用？其实第一个是金融领域。以前有人问我AI能不能用来炒股票，未来有没有机会？我可以告诉大家，用AI炒股票这件事情，不是未来的事情，已经成为过去时。只是因为用AI炒股票这些人，闷声发大财，没有在媒体上宣扬过。但其实这个事情已经跑得相当成熟，特别是在短线、高频的交易里面。

另外，今天发展很好的是在金融领域里面，用AI做放贷，做贷款。以前人工贷款，可能贷一次款需要20万或者是更高的资金，人才产生效率，而且贷款对征信要求严格。今天在金融领域已经做了很多小额的放贷，一次放贷一两千块钱，机器在几秒钟之内就能作出决策。我上次在行业里面沟通，大家达成一个共识，经常举一个例子，如果你是用手机来申请贷款的，机器会根据你手机电量的情况选择是否贷款，如果发现你经常是手机没电的人，就会判断你还贷款的可能性偏低，因为你没有自我管理的能力。或者说，如果机器发现你的电话经常是呼出，没有呼入，那么你还贷款的可能性经过机器计算也是偏低的。

它可能用一千多维的数据做这样的识别，而不像原来只是靠人去调查“你有房吗，有车吗，有固定工作吗”，现在的灵活性高很多。而且机器做，也不追求完全的没有坏帐，比如说有5%的坏帐，对于机器来讲是好事情，因为它拿到了负面的样本。在做训练的时候，通过找到一些不还钱的人，机器才知道这群人有什么样的特征。在这种情况下，机器能自动发觉大量的特征，更好地做贷款。

另一个领域就是医疗，特别是图像，读片子领域，机器一定会取代人。实际机器在今天若干个特定领域里面已经做得很好，目前的难点是怎样让它进入医疗体系。医疗体系比较封闭，很排斥新技术的使用，我认为在未来两三年里，会有很大的突破。

再有就是教育行业，让机器因材施教来命题。对于学习成绩特别好的孩子，给予更复杂的题目，对于学习能力弱的给予简单的题目。

从人适应机器到自然交互

我们来说另外一件事情，人机交互。机器除了在大领域方面提升传统行业的效率之外，还有在交互领域的提升。以前在我们的世界里，人和机器接触时，是人去适应冷冰冰的机器。

上世纪90年代，当时学电脑在中国非常风靡，催生了很多电脑学习班。在当时，学电脑就是学习打字，学习五笔输入法，不知道在座各位还有多少人会使用五笔，那是一个充分让人去适应机器的年代，人要记的东西很多。后来开始走向拼音，继而走向语音。键盘也一样，从鼠标到触屏。

这里有一个简单的逻辑，人可以越来越懒，越来越自然，让机器去适应人。新的时代里面，机器跟人的交互界面会变成自然交互，人们用语言、手势、表情就能跟机器互动。我们可以想像，这个时代到来之后，人跟机器的边界又会被重新定义，这是人工智能在两大领域的使用，一个是改造传统行业的效率，一个是提升人机交互的界面。

Weakness带来的启示

即便面临很多瓶颈，我们还是经常讨论机器会不会最终把人灭掉。上次吴军讲到，我们在讨论机器是否能战胜人、取代人时，就像讨论火星上的房价是否过高一样，都是很遥远的事情。因为当今机器还有大量的弱点，去年AlphaGo在第四局输掉了，我称之为“美妙地输掉了一局”，如果机器五局全胜，人类会陷入一种恐慌。

当时Google的工程师检查程序，得出的结论是这个机器没有Bug，而是有Weakness，也就是说机器有弱点。但凡对机器进行数据训练，到一定阶段就可能会出错，这是深度学习之前不可避免的。今天的AlphaGo升级之后，虽然能力变强了，但是工程师依然无法保证它不会出错。

AlphaGo做得很成功，语音很成功，图像很成功，但是我们还是在一些领域做得不足，尤其是在自然语言的处理方面。搞计算机的都知道图灵测试，是指人和机器隔开的情况下进行测试，如果有超过30%的测试者不能确定对方是人还是机器，那么就认为这台机器具有了人类智能。可以讲，这个时代还没有到来，在可见的时间里面，还会不会到来？

去年，国内有一些研究所开始做一个命题，让机器参加高考，对于这件事情，我可以负责任地告诉大家，机器还没有达到这样的高度，在语言的理解，知识的理解里面，机器做得还不够好，无法通过图灵测试。

语音识别靠谱吗？

举一个简单的例子，如果我们一群人在一块儿聊天，发出不同的声音，你走进去，是能够在几秒钟之内跟踪住一个声音的，能够从多个声音里找到你想听的那个人的声音的。但迄今为止，机器还做不到，几个声音同时发声，机器是无法从中提取出一种声音的，为什么？因为这是它没见过的数据。

机器在今天训练时走的套路，一定是拿一个人的声音进行训练，不管此人是男是女，分别训练没问题，但机器没有听过两种同时发出的声音，所以它做不到。甚至在汽车里面做语音识别，怎么才能做得好呢？车里有车窗的噪音，有风的噪音，有轮胎的噪音，我们需要拿着麦克风到车上把噪音取出来，跟原始语料做叠加，再教给机器学习。所以，在这个领域里面，机器离人还有很远的距离。

语言理解是人工智能的皇冠

另外，机器对于语言的理解能力更差。我在去年去了一个顶尖的剑桥实验室，他们做语言相关的对话系统，机器能帮你订餐，订酒店，做得非常惊艳。自然语言的处理和自然语言的理解是不一样的概念。

左边的NLP是处理的意思；右边的NLU是理解的意思，这个时代还没有到来。跟大家举一个经典的例子，也是我的真实经历，当时机器帮我订好了餐厅，它问我“你需要停车位吗？”我回答“我没车”，于是机器就不懂了，它理解不了“我没车”是什么意思。我问你“你需不需要停车位”，你回答我“要”或者“不要”，这是该领域内的知识。在这个领域里面，目前的计算机还没有很好的模型，在通用领域里面去建立知识逻辑，这是目前很大的缺陷。

语言理解是人工智能下一阶段最核心的事情。在跟人打交道过程当中，我认为让机器掌握语言是核心中的难点。我们都知道，语言是知识和推理的载体，知识的逻辑是靠语言承载的，语言是中间的皇冠。

我最后再补充一点，我们在很努力地做语言方面的业务，给大家秀一个图。

这是今年的一档电视节目，我们造了一台机器放在这里面。今天的人机对话带给大家一个概念，能够提供回答的机器已经代表先进的水准。大家知道IBM Watson在2011年做了一台机器来回答问题，但那时的技术离今天还有距离。

今天的机器可以不再使用文字输入，而是像汪仔一样是靠语音和图像获得题目信息，跟主持人通过多媒体互动，而且没有自己的独立数据库，是把互联网作为它的知识储备。如今的机器还能做抢答等等，这已经代表了问答领域最高的水准。

机器翻译的突破

我们再提一个环节，那就是技术除了在金融领域的应用，在人机交互领域还有一个大的机会，机器翻译。深度学习在这个领域里已经取得了一些突破性的发展，尤其是Google代表了这个领域里最高的高度，从70年代基于规则的机器翻译，到2016年NMT神经网络机器翻译，实现了质的突破。如果以前大家用过一些翻译系统，请问大家使用感受怎么样？翻译的语言读起来特别不流畅。而今天的翻译在深度学习下已经能够做到语言非常流畅，你看不出是人翻译的，还是机器翻译的。唯一的缺点，偶尔会翻译错误，跟AlphaGo下棋一样，这是现在技术还没有能力去突破的。

在日常沟通领域里，比如说商务和旅游领域，机器翻译都没有问题，但在法律等领域目前还做不到。预见未来两三年里面，大家手持翻译机，就可以进行跨语言交流。这个时代的到来是非常激动人心的，对中国是非常有意义的。因为中国的人口在全世界是最多的，但是我们的母语中文不是世界语言，现在我们要跟全世界进行交流，需要拥有翻译的能力。

我们在这方面做了很多的工作，搜狗的搜索可以去搜索全世界的信息，因为它可以将你输入的中文翻成英文去搜索，再翻译成中文来呈现。

这就是我今天想要分享的内容，一方面AI能够带来效率巨大的提升，另外一方面，通过人工智能让大家表达和获取信息更加简单，从而跟机器产生新的互动。

在我内心当中，是把机器当成一种新的生命来看待的，它跟我们的关系就像朋友一样。它在成长，我们需要尊重它，善用它，它能帮助我们做好事，能成为社会当中的一部分。一旦我们学会怎么跟机器相处，就能更好地学会怎么跟人去相处，谢谢！