大数据质量(big data quality),理学-计算机科学技术-计算机应用-信息系统-﹝信息系统其他﹞,大数据集合的正确性、适时性、精确性、完备性、相关性及可访问性在特定应用场景下的适用性。在ISO/IEC 25012:2008国际标准化组织标准规范中,将数据质量定义为“在特定条件下使用时,数据特性能满足明确的和隐含的要求的程度”。此标准定义了一个数据质量模型,模型将质量分为内部视角和系统依赖视角,并细分了准确性、完整性、一致性和可信性等15个质量维度。针对具体的数据集合,可通过质量度量来评估数据质量。在ISO/IEC 25024:2015国际标准化组织标准规范中,根据度量对象的不同,分为过程度量、数据度量和数据使用度量。此标准对于ISO/IEC 25012:2008给出的质量维度,定义了一系列具体的度量指标,每个指标包含一个度量函数以及适用的数据实体。传统数据质量是软件产品质量的一部分。而在大数据场景中,来源于多个软件系统的数据多次融合,形成面向不确定场景的独立可用的数据。因此,大数据质量虽然在内涵上与传统数据质量统一,但外延有诸多差别。