数据挖掘匿名保护(anonymous protection of data mining),管理学-管理科学与工程-大数据与知识管理-大数据-大数据安全-隐私保护,在大型数据集寻找发现可行信息的过程中,以匿名化模型对商业机密或隐私内容进行保护处理,防止大量敏感字段泄露的处理技术。随着大数据时代的来临,数据爆发式增加,共享使得信息道德出现危机。原始数据集具有个体标识属性、准标识属性、敏感属性、非敏感属性等特性。攻击者会通过链接攻击、同质性攻击、相似性攻击等方式窃取用户敏感属性数据,利用数据挖掘技术加以提炼,获取威胁用户隐私安全的信息。科学的数据挖掘系统应保证挖掘信息完整准确的同时,限制挖掘个人隐私信息的能力。匿名化是数据挖掘保护个人隐私的最主要技术。常见的四种匿名保护模型为K-匿名隐私保护模型、L-多样性模型、(α,k)-匿名模型、t-closeness模型,其中K-匿名隐私保护模型应用广泛,针对一次性静态单敏感属性数据,K取值影响隐私保护度和数据可用性。匿名技术主要包括泛化技术、抑制技术、扰乱技术、有损连接,以一般化、隐藏敏感属性、加入噪声值、损失连接等方式进行匿名化处理。