数据降维(data dimension reduction),工学-控制科学与工程-智能控制-智能控制-模糊控制-可视分析,大幅降低高维数据空间的维数,但仍保证原数据库的完整性的技术。即使得约减后的数据空间能够反映原数据空间特征的技术。又称数据维数约减。数据降维是针对维数灾难或高维数据提出来的。降维后的数据分析难度、数据存储量与分析运算量将大幅降低,且结果与原数据空间基本一致,避免了维数灾难的发生。因而广泛应用于机器学习、数据挖掘、大数据等领域。数据通常通过特征选择或特征提取的方法进行降维。特征选择指为了构建模型而选择相关特征(即属性或指标)子集的过程,又称变量选择、属性选择或变量子集选择。特征选择可以被视为搜索技术和评价指标的结合,前者提供候选的新特征子集,后者为不同的特征子集打分。特征选择一般要求数据中包含大量冗余或无关变量(或称特征、属性、指标等),从而可以从原有变量中找出主要变量,其代表方法为最小绝对收缩和选择算子(least absolute shrinkage and selection operator; LASSO),即LASSO特征选择算法。