最小错误率训练

（理学 | 计算机科学技术）

最小错误率训练（minimum error rate training），理学-计算机科学技术-人工智能-自然语言处理-机器翻译-统计机器翻译-参数训练，统计机器翻译中判别式模型的参数训练方法，其目标是计算一组参数使得模型预测的候选译文在开发集上获得最小的错误率。对数线性模型是统计机器翻译中常用的判别式模型，其整体的翻译概率是特征函数与特征权重的加权组合。最小错误率训练的目标是通过调节特征权重，使得模型概率最高的候选译文的错误率最小。错误率可以通过机器翻译评价指标如BLEU、NIST和TER等来进行评估。最小错误率训练算法是Powell搜索算法的扩展，其基本思想是每次只优化一个特征权重，将其他的特征固定。因此，每个候选译文可以表示为二维空间中的直线。算法沿着空间中的某一维寻找一个更好的点以降低错误率。如果最优参数值与当前值不同，则改变当前值，然后优化下一个参数，直至没有参数变化使得翻译错误率获得进一步降低。直线在空间中的交点表示候选译文的选择发生变化。因此，只要计算出决定概率最高译文选择发生变化的关键交点，就可以确定参数选择的区间。