智能语义分析,在成本和成效的平衡中发展 ——神州泰岳张瑞飞如是说

智能语义分析,在成本和成效的平衡中发展 ——神州泰岳张瑞飞如是说

自然语言的概念是无限的,概念单元是有限的;语言是无限的,句类是有限的;语境是无限的,语境单元是有限的。

5月20日,神州泰岳AI大数据副总裁张瑞飞受邀出席在国家会议中心举办的2018 GAITC全球人工智能技术大会“自然语言处理”论坛,并做了题为“认知能力:在成本与成效中平衡”的精彩主题演讲。

神州泰岳AI大数据副总裁张瑞飞

张瑞飞指出,神州泰岳在人工智能领域主要的攻坚点在自然语言处理的能力,我们更加关注怎样把人工智能技术转化为企业的盈利目标,在自然语言处理方面要取得成本和成效的均衡。

神州泰岳在人工智能基础上的投入非常坚定。在数据的获取和处理层面,神州泰岳投入大量资源,成功获取400万份有效样本,并在此基础上做了向量化和特征提取,可覆盖99%的应用场景,有效提升了系统的泛化能力。同时,神州泰岳采用独特方法,解决多态性的问题,实现了属性要素的提取,尤其是对事件的地点、物品、手段、特征、码号等要素的提取,其中包括190多万个地址库。

在上述投入的同时,神州泰岳引入最新的技术理念,优化算法,提升成效:采用迁移学习,减少样本模型训练的样本量;通过深度学习和DINFO-OEC非结构化文本分析挖掘平台,在命名实体识别场景,实现数据处理10%-15%的结果优化。

在谈到人工智能的应用成效时,张瑞飞指出,神州泰岳面向公安系统,建立了一体化的合成作战平台,在语义解析引擎、互联网数据采集、大数据流水线、数据展现、流程引擎以及融合通讯等基础能力上,不断扩充应用,最终形成可落地的行业应用体系。最近神州泰岳和北京师范大学的自然语义联合实验室在业界首次推出了NLP集成开发环境,把语义资源、算法体系、场景化能力等集成在一起。

“自然语言处理”论坛

最后,张瑞飞呼吁,鉴于自然语义处理技术开发的难度,业界应当建立生态联盟,在共同在生态中合作起来,共通共享,降低成本,发挥各自在不同的领域里形成的独特优势,共同提升自然语言的处理能力。

相关领域
人物