纠错输出编码(error correcting output codes),理学-计算机科学技术-人工智能-机器学习-线性模型,一种解决多类分类的常用技术。纠错输出码的工作过程主要分为两步。第一步,编码。对个类别做次划分,每次划分将一部分类别当作正类,其余当作反类,从而形成一个二分类训练集,这样可以训练出个二分类分类器。编码过程中类别的划分通过编码矩阵指定,编码矩阵的每一行表示一个类别,每一列表示一个二分类分类器。编码矩阵主要包括二元码(图(a))和三元码(图(b))。二元码中+1和-1分别表示,所在列二分类分类器将所在行类别作为正、反例;三元编码中0表示,所在列二分类分类器不使用该类样本。常见的编码方法有一对一、一对多、随机编码等。纠错输出码示意图第二步,解码。个分类器分别对测试样本进行预测,这些预测标记组成一个编码。将这个预测编码与每个类别各自的编码进行比较,返回其中距离最小的类别作为最终的预测结果。常见的解码方法有海明解码(见海明码)和欧氏解码等。“纠错输出编码”名称的由来,是因为在测试阶段,其对分类器的错误有一定的容忍和修正能力。