测验偏向义同测验公平性(test fairness)。以与>测验无关的因素来区分人群所做出的预测。主要内容如包含有数学知识的阅读理解测验可能有利于数学较好的被试,而不利于数学较差的被试。常见的偏向有宗教、种族、文化和性别等。 主要因素如果我们要使用测验去预测某种未来情境中的结果,例如某申请者在大学里或在某项工作上的表现,那么我们需要测验对特定的效标具有高度的预测效度。在编制所谓的文化公平测验(culture.fair test)时,通常忽略了这种要求。为了在这类测验中仅仅包括不同的文化或亚文化共同的机能,我们可以选取对于我们希望预测的效标没有什么关系的内容。一种较好的解决方法是,选取和效标有关的内容,然后研究对于测验目的而言,测验有效性中可能存在的总体差异。效度系数、回归权重、临界分数等都可以随测验参加者经验背景的差异而有所变化。因此,对于有理由预期会有这类影响的各亚团体,我们应该检查其中的这些数值。这些可能的亚团体差异被认为是前一节所讨论的蒯节变最的一种特例。回忆一下,探索显著的、稳定的调节变量证明是令人失望的。应当指出,如果测验和效标成绩有内在关