云知声陈吉胜:声音是人机交互最自然的方式

云知声陈吉胜:声音是人机交互最自然的方式

科技发展日新月异,2017年被人们称为人工智能元年,闪耀着技术光芒的人工智能技术开始多点开花,云计算、物联网、大数据和人工智能等前端科技已经迅速向外扩延,走入我们的生活,一个万物互联的物联网时代已经到来。

百度总裁陆奇曾经说过:“人工智能的时代是一个赋能的时代。” 可以说AI是一种非常基础的资源,对各个行业都可以赋能。人工智能赋能的大趋势是处在感知智能向认知智能发展的渐进过程。随着深度学习、大数据的能力的提升,成本结构的下降,互联网+时代开始向着人工智能+时代迈入。

而在这样的时代机遇下,也造就了中国人工智能产业的发达。尤其在语音识别领域,科大讯飞、思必驰以及云知声已经走在了时代浪潮的前沿。

云知声loT事业部副总裁陈吉胜

正如云知声IoT副总裁陈吉胜认为:“对于人类来说,声音永远是交互最自然的一个方式”。带着这样一种信念与想法,云知声从2012年开始,在众多的语音团队中杀出了一条血路,让更多的人感受到了声音的魅力,让人工智能落地。

首提“语用计算” AI芯片落地打造生态闭环

在场景化的落地过程中,通过自然语言进行语音对话的交互方式是人机互动最理想的一种沟通方式。

早年,陈吉胜与云知声创始人黄伟都是摩托罗拉的老同事,当时陈吉胜便已经开始研究语音识别、语音合成以及图像识别等新型人机自然交互方案。之后在埃森哲任通信、索尼爱立信等公司兜兜转转,在2015年6月,陈吉胜加入云知声,专门负责云知声的技术落地与产品化。

正如陈吉胜所说:“交互体验,这是我们整个云端新战略的一个出发点,也是我们云知声商业逻辑,能够成立和落地的一个根本。”为了给用户带来更直观、舒适的交互体验,云知声通过AI芯、AIUI端、AI Service三大解决方案构建“云端芯”生态体系,提供跨硬件平台、跨应用场景的软硬件一体化云端+本地智能的芯片终端解决方案,AI芯连接各种硬件产品,解决终端的感知问题,而AIUI则解决用户与终端之间的语音交互方式,AI Service则是提供了云端的支持。

据悉,云知声的AI芯片将内置DNN处理单元,兼容多麦克风、多操作系统。也就是说,从云知声的AI芯片的落地场景,其客户有了在选择云知声的同时就拥有了一整套云端芯的服务。

云知声资料图

不久前,云知声完成技术引擎3.0版升级,并且首次提出“语用计算”的概念,语义主要研究字面意义,但语用则是研究语境意义,重点是“用意”,基于在深度学习,高性能计算能力和大数据等方面的迭代,云知声从信号层面到云的感知层面、自然语言理解层面实现多维度的语义理解提升,从感知、认知再到通用,实现最全面的人工智能交互场景。

陈吉胜认为,语用计算是语义理解的下一阶段,人机对话交互的核心是语用计算,而不仅仅是语义理解。通过研究语境意义,去理解话语在特定语境中所传递的交际意义。

语音的实用化、产品化:语音技术前景可期

纵观整个互联网发展过程,PC时代我们依赖于鼠标键盘进行人机交互,移动互联网时代发展衍生的手机触控技术,再到智能语音助手,iPhone的Siri、亚马逊的echo,在万物互联的物联网时代,面对更加类人脑思维的人工智能,语音交互是更为自然的一种交互方式。

语音识别领域的厮杀,在这些年显得非常激烈。“语音技术其实并不难,难的实际上是把它使用化产品化”,陈吉胜表示。

语音作为最自然的交互工具,目前被广泛认定为智能家居乃至物联网的入口。云知声正是看准了这个入口,砥砺前行,终于成为了今日行业的中流砥柱。

陈吉胜与维辰

在商业领域,云知声主要选择的一个是智能家居、智能车载系统、互联网教育以及医疗四个方向的布局。这几个场景有一个共通的地方,那就是相对封闭性。在这个封闭的环境里面使用语音,人们会感觉更加舒适与放松。

第二个实际上就是在对应的场景,要做一个实用化的水平。用户拿到的是最终的一个产品,产品给予的反馈成功率才是用户关心的点。从这一点上来说,云知声相对于国内其他公司,具有明显优势。

如果AI没有具体的应用场景,那么他离用户是很远的。云知声通过将语音助手和场景结合,使得它可以服务于各行各业。即使面对搜狗、科大讯飞、苹果、谷歌等强大的竞争对手,陈吉胜并不是很担心,毕竟战争才刚刚开始。

春江水暖鸭先知,谁也不知道互联网下一个风口会什么时候流行,但是,语音识别正确率的不断提高,解放人类双手是大势所趋。时代的推波助澜,会让云知声走得更远、更稳。

(创TALK原创文章,转载请注明出处)

作者:祁琴慧、郁白出镜:维辰

编辑:夏天

相关领域
人物