特征学习(feature learning),理学-计算机科学技术-人工智能-机器学习-特征学习,将原始数据转换成为能够被机器学习有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。一个学习对象往往由一组特征来表示,一个特征是用来反映事件或对象在某方面的表现或性质的事项。以往在机器学习用于现实任务时,描述样本的特征通常需要由人类专家来设计,这称为特征工程(feature engineering)。众所周知,特征的好坏对泛化性能有至关重要的影响,人类专家设计出好特征也并非易事。特征学习则通过机器学习技术自身来产生好特征,这使机器学习向“全自动数据分析”又前进了一步。字典学习是一种典型的特征学习方法,其基本思想是从样本中学习出一组字典,并且将每个示例表示成这些字典的加权和。一般希望这个加权和与示例真实特征之间的误差越小越好,因此可以通过最小化整个样本集合上的表示误差来优化字典以及对应的权重。通常在最小化误差的同时还会加入L1正则项来使得权重更加稀疏,也就是要求每个示例仅仅由字典中的少数元素的加权和表示。