纠错输出编码

（理学 | 计算机科学技术）

纠错输出编码（error correcting output codes），理学-计算机科学技术-人工智能-机器学习-线性模型，一种解决多类分类的常用技术。纠错输出码的工作过程主要分为两步。第一步，编码。对个类别做次划分，每次划分将一部分类别当作正类，其余当作反类，从而形成一个二分类训练集，这样可以训练出个二分类分类器。编码过程中类别的划分通过编码矩阵指定，编码矩阵的每一行表示一个类别，每一列表示一个二分类分类器。编码矩阵主要包括二元码（图（a））和三元码（图（b））。二元码中+1和-1分别表示，所在列二分类分类器将所在行类别作为正、反例；三元编码中0表示，所在列二分类分类器不使用该类样本。常见的编码方法有一对一、一对多、随机编码等。纠错输出码示意图第二步，解码。个分类器分别对测试样本进行预测，这些预测标记组成一个编码。将这个预测编码与每个类别各自的编码进行比较，返回其中距离最小的类别作为最终的预测结果。常见的解码方法有海明解码（见海明码）和欧氏解码等。“纠错输出编码”名称的由来，是因为在测试阶段，其对分类器的错误有一定的容忍和修正能力。