用于信息检索评测的测试集一直推动着检索系统的研究、设计与发展。检索测试集主要由文档集、查询集、相关判断集三个部分构成。国外比较典型的测试集有TREC(Text RE-trieval Conference)、CACM、ISI等。国内尚无建立起标准的可用于中文信息检索评测的小型测试集。用于信息检索评测的测试集一直推动着检索系统的研究、设计与发展。研究者进行信息检索评测的一般模式,是将需要查询的问题形成查询语句,输入检索系统,检索系统在文档集合内进行检索,将可能符合要求的文档提交给研究者,研究者再将得到的文档和标准答案作对比,以此评价检索系统的性能。因此,检索测试集主要由文档集、查询集、相关判断集三个部分构成。