k近邻聚类(k-nearest neighborKNN) clustering),理学-化学-分析化学-化学计量学-化学模式识别与方法分类-聚类分析,一种基本的分类与回归方法。在模式识别领域,该方法是一种非参数算法,可被用于建立分类及回归模型。在使用此种方法求解时,首先通过在特征空间中获取个属于建模训练集的离待测输入样本最近的样本点,随后由其具体处理分类或回归问题而得到不同的预测输出。若此方法用于分类问题的求解,则其预测输出为待测样本点的类别标签。由个近邻点根据类别标签进行投票,获得最高投票数的类别标签即为输出。若此方法用于回归问题的求解,则其预测输出为待测样本点某一性质的具体数值,通过计算个近邻点的平均值而获得。近邻分类算法是一种基于实例的学习或即时学习算法,其是最简单的机器学习算法之一。在进行分类或回归问题的求解过程中,可以通过待测样本点的远近,指派各个近邻点权重,从而区别各近邻点的贡献程度。距离待测样本点越近,则该训练集样本点的贡献度越大。通常各近邻点的加权系数为,其中为此近邻点与待测样本点之间的距离。