划分聚类

（理学 | 计算机科学技术）

划分聚类（partition clustering），理学-计算机科学技术-人工智能-知识发现-聚类分析，聚类分析中最常见的一类算法，这类算法的主要特点是根据某一目标函数将数据集划分成若干个类。典型的划分聚类算法分为两类：基于类中心的K-means、基于代表点的K-medoids。数据集包含个数据点，式中为一个维的向量，K-medoids算法将该数据集划分成类，，使下列目标函数(Sum-of-Absolute-Errors)最小：式中是类的代表点，表示与的相异度。K-medoids算法包括如下几步：定义对象的相异矩阵，选取初始代表点，反复交换代表点与非代表点直至SAE不能减少。K-medoids由于不求类的均值，其相异矩阵的定义则可不使用欧氏距离。初始代表点通常随机选取，也可特别选择。确定一个非代表点是否可代替代表点，对于对象的重新划分可考虑4种情况：①如果，且，那么分配给。②如果，且，那么分配给。③如果，，且，那么仍分配给。④如果，，且，那么分配给。