大数据相关性分析(correlation analysis of big data),工学-信息与通信工程-大数据处理-大数据分析-大数据相关性分析,对海量数据集合中两个或多个具备相关性的变量元素进行分析的过程。大数据不仅数据量大,而且种类繁多,增长速度极快。在这些海量数据中,以电子邮件、文档、高清视频、音频、图形图像为主,在这些数据中,除了部分结构化数据外,非结构化数据占有很大一部分且增长极为迅速,而关系型数据库中的结构化数据增长则相对比较缓慢。大数据相关性分析包括几个方面:①相关技术。通过可视化分析、数据挖掘算法的研究和优化、基于云平台的数据相似度对比技术、网络知识库等技术。②相关关系。相关关系是指两个或两个以上变量取值之间在某种意义下所存在的规律,其目的在于探寻数据集里所隐藏的相关关系网。③相关性分析。相关性分析是指衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。常见的大数据相关性分析分为2类:①面向高度复杂的数据关系;②面向高维数据。