半监督聚类(semi-supervised clustering),理学-计算机科学技术-人工智能-机器学习-弱监督学习-半监督学习,半监督聚类是近几年机器学习领域的一个新的研究方向, 也是数据挖掘的一个重要分支,逐步成为许多领域的有用工具。聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(cluster),通过这样的划分,每个簇可能对应于一些潜在概念(类别)。聚类通常是一种典型的无监督学习任务,然而在现实聚类任务中我们往往能获得一些额外的监督信息,于是可通过半监督聚类(semi-supervised clustering)来利用监督信息以获得更好的聚类结果。半监督学习的研究一般认为始于[Shahshahani and Landgrebe, 1994],该领域在二十世纪末二十一世纪初随着现实应用中利用未标记数据的巨大需求涌向而蓬勃发展。