覆盖率准则(coverage criteria),管理学-管理科学与工程-预测理论与方法-预测模型选择准则-覆盖率准则,用于统计模型变量选择的一种准则。主要思想是将包含部分自变量的回归残差平方和与包含所有自变量的回归残差平方和相比较,从而选择出自变量的最优子集进行回归分析。对于一个线性回归模型,可以定义为(1)其中是基于所选择的个自变量的回归残差平方和,是包含所有自变量的回归误差项方差的估计,是样本量。包含所有自变量的回归均方误差通常被用作估计。取值越小,表示所选择的变量越具有解释意义,对应的模型越优。一个足够好的模型应满足。对于一个包含个自变量的回归模型,的另外一种定义方式为(2)其中RSS是训练数据的残差平方和,是包含所有自变量的回归误差项方差的估计。在RSS的基础上加入作为惩罚项,可以较好地避免过拟合。如果是的无偏估计,这种定义下的是测试样本均方误差的无偏估计。在实际应用中,的两种定义方式是等价的,经常被用作逐步回归变量选择的停止标准。通常做法是画出与的散点图,选择最小所对应的模型或者选择与最接近且满足的模型。如果已知,任何可以给出回归系数无偏估计的模型都满足。