划分聚类(partition clustering),理学-计算机科学技术-人工智能-知识发现-聚类分析,聚类分析中最常见的一类算法,这类算法的主要特点是根据某一目标函数将数据集划分成若干个类。典型的划分聚类算法分为两类:基于类中心的K-means、基于代表点的K-medoids。数据集包含个数据点,式中为一个维的向量,K-medoids算法将该数据集划分成类,,使下列目标函数(Sum-of-Absolute-Errors)最小:式中是类的代表点,表示与的相异度。K-medoids算法包括如下几步:定义对象的相异矩阵,选取初始代表点,反复交换代表点与非代表点直至SAE不能减少。K-medoids由于不求类的均值,其相异矩阵的定义则可不使用欧氏距离。初始代表点通常随机选取,也可特别选择。确定一个非代表点是否可代替代表点,对于对象的重新划分可考虑4种情况:①如果,且,那么分配给。②如果,且,那么分配给。③如果,,且,那么仍分配给。④如果,,且,那么分配给。