科学大数据(scientific big data),工学-信息与通信工程-大数据处理-大数据应用-科学大数据,大型仪器设备、大科学装置、大规模传感器网络等自动化采集的海量数据集合。科学数据是以科学证据形式存在的事实,它至少应该包括科学观测与监测数据、实验数据、计算与模型模拟输出数据、对情景或现象的描述数据、对行为的观测或定性的描述数据、用于管理或者商业目的的统计数据,以及描述数据的元数据等。它们通常是科研活动的输入,是证实与证明伪科学发现、科学观点的事实与证据,或者是论证推理的基础。科学数据的特点主要是产生的速度快,数据量和复杂性高,存在着不确定性和噪声。随着越来越多的诸如500米口径球面射电望远镜、中国散裂中子源等大科学装置的建设和重大科学实验的开展,以及科学传感器和传感器网络广泛应用于天空、陆地和海洋,对自然环境进行全方位的探测、监测,源源不断产生的科学数据将科学研究快速推进到一个前所未有的大数据时代。