泛化能力(generalization ability),理学-计算机科学技术-人工智能-机器学习-学习理论,训练出的模型适用于新样本的能力。在计算机系统中,“经验”通常以数据的形式存在,因此机器学习所研究的主要内容是通过这些数据产生“模型”(model)。从数据产生模型的过程我们称之为“训练”(training),训练过程中使用的数据称为“训练数据”。我们训练得到模型后需要对模型进行评估。我们通常把分类错误的样本数占总数的比例称为“错误率”(error rate)。更一般的,我们把模型实际预测的输出与真实的输出之间的差异称之为“误差”(error)。机器学习的目标是使得训练出的模型很好的适用于未见样本。训练出的模型适用于新样本的能力,称为“泛化能力”(generalization ability)。具有较强泛化能力的模型不仅在训练数据上有好的表现,还能够很好的适用于整个样本空间。通常我们假设所有的样本都服从一个未知的分布,我们的训练数据中每个样本都是从这个分布上独立的采集的,即“独立同分布”(independent and identically distributed)。