过滤方法(filter methods),理学-计算机科学技术-计算机应用-多媒体计算-模式识别-线性特征提取-特征选择,一类特征选择算法。此类方法将特征对响应变量的相关程度,即特征相关度,作为特征选择的评估准则,首先基于训练数据计算得到输入特征的相关度,并选出相关度较高的特征,将所得相关特征用于后续预测。在选择特征时,可根据单个特征的相关度将其排序、根据预设的阈值对低排名(即不相关)的特征进行滤除,也可计算特征子集的相关度和通过搜索或目标函数优化得到较优特征子集。由于无需额外学习,且与后续使用的预测模型无关,过滤方法可视为一种预处理方法,相较于其他特征选择算法所需的计算量通常更小、其泛用性更高,尤其在特征数量较大时有着不可或缺的作用;但另一方面,缺乏模型针对性也使得其选择得到的特征并不一定适用于后续模型,性能往往弱于其他方法。过滤方法最早出现于20世纪60年代。此类方法的关键在于如何定义特征相关度,常用度量主要包括统计度量、信息度量、距离度量、一致性度量等。