数据挖掘隐私保护

（管理学 | 管理科学与工程）

数据挖掘隐私保护（Privacy-Preserving Data Mining），管理学-管理科学与工程-大数据与知识管理-大数据-大数据安全-隐私保护，在不破坏个人隐私和共同隐私的情况下进行数据挖掘的技术。又称知识隐藏。个人隐私主要指个人不愿意公开的私密数据，如银行卡号、用户密码等; 共同隐私主要指两人及两人以上所拥有的共同信息或模式。1995年，第一届KDD(knowledge discovery in datasets)会议首次提出数据挖掘隐私保护的概念。1999年，数据挖掘隐私保护被列为数据挖掘研究领域的重点研究之一。数据挖掘隐私保护包括两个方面的内容：①对敏感数据本身进行隐藏。隐藏的方法就是在数据发布之前将原数据中涉及隐私或敏感的信息删除或修改，这类方法一般是通过扰动、抽样、泛化、随机、匿名化、加密等技术来实现。 ②对敏感知识进行隐藏。这类方法保护的是敏感的挖掘结果，例如挖掘出的知识样模。此方法会与特定的某种数据挖掘算法结合起来，用数据失真或阻塞等技术来防止敏感知识样模的泄露。数据挖掘隐私保护的重要内容是数据挖掘过程的保护，同时防止信息泄露。