高斯混合(Gaussian mixture),理学-计算机科学技术-人工智能-知识发现-聚类分析,单一高斯概率密度函数的延伸,是用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计模型。设数据集,任意样本的高斯混合分布的密度函数可表示为,其中为维的向量,是第个高斯分布的权重,且,和是高斯分布的参数,即均值向量和协方差阵。通过增加不同高斯分布的数量,高斯混合模型(GMM)可以平滑任意形状的概率分布,也就是说任意形状的概率分布都可以用多个高斯分布函数去近似,其参数求解方法一般使用EM(最大期望值)求解方法。EM算法分两步,E步估计隐含变量,M步估计其他参数和,交替将极值推向最大。通常,类似于-means聚类算法,高斯混合分布中的个数需提前给定。