泛化能力

（理学 | 计算机科学技术）

泛化能力（generalization ability），理学-计算机科学技术-人工智能-机器学习-学习理论，训练出的模型适用于新样本的能力。在计算机系统中，“经验”通常以数据的形式存在，因此机器学习所研究的主要内容是通过这些数据产生“模型”（model）。从数据产生模型的过程我们称之为“训练”（training），训练过程中使用的数据称为“训练数据”。我们训练得到模型后需要对模型进行评估。我们通常把分类错误的样本数占总数的比例称为“错误率”（error rate）。更一般的，我们把模型实际预测的输出与真实的输出之间的差异称之为“误差”（error）。机器学习的目标是使得训练出的模型很好的适用于未见样本。训练出的模型适用于新样本的能力，称为“泛化能力”（generalization ability）。具有较强泛化能力的模型不仅在训练数据上有好的表现，还能够很好的适用于整个样本空间。通常我们假设所有的样本都服从一个未知的分布，我们的训练数据中每个样本都是从这个分布上独立的采集的，即“独立同分布”（independent and identically distributed）。