查询表示(query representation),理学-计算机科学技术-计算机应用-信息系统-信息检索-信息检索查询处理,将用户输入的查询表示成检索系统便于处理的形式的过程。在进行查询表示时,通常首先对查询进行分词和去停用词处理,目的是为了区分和保留查询中的有效成分,然后再采用布尔表达式法或词向量法对查询进行表示。布尔表达式法是指将查询表示为用“AND”(与)、“OR”(或)、“not”(非)连接的形式,如查询“清华大学的保送生或特长生”,可以表示为“清华AND大学AND(保送生OR特长生)”。词向量法是商业搜索引擎中广泛使用的算法,该算法用多维向量表示查询,不同维度代表不同词汇,词向量不同维度上的数值表示相应词汇的权重。常见的为词向量计算权重的算法有“0-1”模型、“词袋”模型、“Word2vec”算法等。现代搜索引擎中也会采用多种自然语言处理技术以对查询进行更高效的表示,包括带词性标注的分词技术、命名实体识别技术、知识图谱技术等。检索系统具体采用哪种查询表示算法,由检索系统所采用的查询与文档之间的匹配算法决定。