信息检索多样性(information retrieval diversification),理学-计算机科学技术-计算机应用-信息系统-信息检索-检索模型与排序,检索结果对于多个主要信息需求的覆盖程度。在信息检索系统中,用户输入的查询往往简短且具有歧义。同一查询往往可能覆盖多个子话题或者子信息需求。如果直接采用朴素的检索算法,往往使得搜索结果同质性较高,即绝大多数检索结果都与某一主要的意图或话题相关,导致对于较为冷门、小众的信息意图覆盖程度较差。因此检索系统往往需要采用意图理解技术,对于歧义查询背后可能包含的多种信息意图进行建模,重新对检索结果进行排序,使得排位靠前的结果满足多个主要的信息意图。在实际的检索系统中,对检索结果进行多样化处理的算法主要分为两种:第一种是对用户查询进行显式的意图分析,列出多个潜在的子意图,对结果进行重新排序,以提高对子意图的覆盖率。第二种是直接处理检索结果,对于每个文档,如果其内容与排在其之前的文档重合度较高,则降低排序。