anonymity
大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难
大数据时代的到来,同时也带来了隐私、敏感信息保护方面的棘手难题。数据脱敏措施层出不穷,K-Anonymity,L-Diversity,T-Closeness,以及相结合的微聚集算法,能够在保证数据效用的同时,最大化防止隐私数据泄露,本次学术报告详细讲解了T-Closeness的原理、用来计算两种概率分布距离的EMD(Earth Mover ‘s distance)算法和三种基于T-Closeness微聚集的数据脱敏算法原理,并在数据集上实验了三种微聚集算法,查看了生成簇大小、时间成本和数据效用等实验结果,最后分析得到的实验结果和数据。