跨语言文本检索(cross language text retrieval),理学-计算机科学技术-计算机应用-信息系统-信息检索-特殊类型信息检索,用一种提问语言检索出另一种语言或多种语言描述的文本信息,即跨越语言界限进行检索。跨语言文本检索是信息检索中一块活跃的子领域,也是致力于查询相关文档以及包含在文档中的相关信息。同单一语言检索不同的是,跨语言检索的目标是找到语言与查询词不同的文档及信息,比如用户提交一个中文查询词到跨语言检索系统中,检索得到英文文档结果。为了解决查询词与文档语言差异,通常的解决方法是在执行检索过程之前,对查询词和(或)文档进行翻译。因此,翻译是跨语言文本检索中的关键问题。在跨语言文本检索系统中,翻译主要有3种途径:①将查询词的表示映射到文档的表示空间(查询翻译)。②将文档的表示映射到查询词的表示空间(文档翻译)。③将查询词和文档的表示同时映射到第三类空间(双重翻译)。考虑到效率和准确性,目前最常用的是查询翻译。对于跨语言文本检索中的翻译技术,主要有三种直接的翻译方法:①基于字典的翻译技术。②基于机器翻译的翻译技术。③基于语料库的翻译技术。