词包(bag-of-words),工学-信息与通信工程-模式识别-显著性检测-词包,在自然语言处理和信息检索领域中,忽略文本的语序,用一组无序的词汇来表达一段文字或一个文档的文本特征表示方法。通过对文本中出现的词汇进行频数统计,从而形成一个稀疏向量对其进行表达,向量的维度等于字典中词汇的个数。在计算机视觉领域中,词包被用来表达图像特征。类比于文本,图像中的词汇(单词)可视为某种局部特征描述子。由于特征之间存在差异,所以不能直接进行频数统计。为了解决这个问题,视觉词包通常采用对大量的局部特征描述子进行聚类的方式来构造字典。聚类数目为字典的大小,聚类中心为字典的原子,即单词。在频数统计时,一个局部特征描述子根据某种距离度量方式被划归到某个聚类中,该聚类的频数加一。由此,通过视觉词包方法,能够用一个向量来对图像进行表达,该向量的每个元素等于相应字典原子的频数。