软间隔(soft margin),理学-计算机科学技术-人工智能-机器学习-统计学习,机器学习中主要研究在不同类别的数据难以线性可分的情况下,如何构造数据的划分超平面的核方法的技术。在机器学习中,软间隔是一种支持向量机(support vector machine, SVM)的形式,用于构造数据的划分超平面。与之相对的概念称为硬间隔(hard margin)。给定训练集,支持向量机找到一个划分超平面,将不同训练样本分类。若训练样本在样本空间或特征空间线性可分,即存在一个划分超平面能将所有训练样本正确分类时,那么可以在两个类之间构造出一个最大间隔的超平面。这样的间隔称为硬间隔。在现实任务中难以确定合适的核函数(kernel function),使得训练样本在特征空间中线性可分。若使用复杂度很高的核函数将训练样本强行分开,容易产生过拟合现象,导致模型的泛化性能下降。使用软间隔的划分方式,允许支持向量机在一些样本的分类上出错,以此缓解上述问题。