度量学习

（理学 | 计算机科学技术）

度量学习（metric learning），理学-计算机科学技术-人工智能-机器学习-特征学习-特征变换，一系列自动从数据中学习相似度或距离函数的方法，最初由Eric Xing等人于2002年提出，用于在具有弱监督信息的环境下辅助聚类。许多学习算法均依赖于样本之间的相似度或距离计算，如k近邻算法、核方法、聚类算法等。有效的、符合数据本身性质的距离或相似性度量能够增强后续学习模型的能力。在学习距离函数时，需要满足非负、自反、对称与三角不等式4个性质，距离越大，说明一对样本越不相似；一般度量学习方法也会学习伪距离（度量），即不需要满足自反性质。而相似性函数需要满足对称性，一般而言，函数输出值越大，说明一对样本越相似。度量学习的学习模式依赖于不同类型的附加信息（side information）。常见的形式有：①类别标记（完全监督信息）。即训练阶段能够直接获取到每一个样本的类别。②成对信息（弱监督信息）。即直接给定一对样本的相似或不相似关系，经常表现为必连接（must-link）和勿连接（cannot-link）。③相对比较信息（弱监督信息）。