误差－分歧分解

（理学 | 计算机科学技术）

误差－分歧分解（Error-ambiguity decomposition），理学-计算机科学技术-人工智能-机器学习-集成学习，分析集成学习泛化能力一种重要工具，由安德斯·克罗格（Anders Krogh）和杰斯珀·韦德尔斯比（Jesper Vedelsby）在1995年提出，适用于完成回归学习任务的集成学习。其目的是阐述对于集成学习，集合中个体学习器准确性和多样性，与集合泛化性之间的关系。误差-分歧分解将集合的泛化误差分解为两个部分，一个部分为个体学习器的泛化误差，另一个是个体学习器的分歧。个体学习器的泛化误差是计算个体学习器预测结果与期望结果的平方误差，表征个体学习器在样本上的准确率，在一定程度上反映了个体学习器的准确性。个体学习器的分歧是计算个体学习器预测结果与集合预测结果的平方误差，表征个体学习器在样本上不一致性，在一定程度上反映了个体学习器的多样性。集成的泛化误差计算公式如下，具体数学推导过程见：式中，是集合的泛化误差，是集合内全部个体学习器泛化误差的加权平均值，是集合内全部个体学习器分歧的加权平均值。集合泛化误差是所有个体学习器的泛化误差加权均值与分歧加权均值的差值。