[发明专利]基于隐私保护的数据共享装置、方法及可读存储介质在审
申请号: | 201910977136.0 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110737917A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 吴良顺 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 44334 深圳市赛恩倍吉知识产权代理有限公司 | 代理人: | 饶智彬;孙芬 |
地址: | 430000 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据记录 隐私数据库 目标属性 欧式距离 数据共享 预设 计算机可读存储介质 预处理 数据共享请求 原始数据库 计算目标 聚类操作 聚类算法 数据隐私 数目要求 隐私保护 相关度 共享 排序 泄露 存储 储存 筛选 | ||
1.一种基于隐私保护的数据共享方法,其特征在于,所述方法包括:
对原始数据库的每一数据表的属性进行预处理,以得到多张属性相关度排序在预设位之前的目标数据表,其中每一所述数据表的属性至少被划分为两种类型,所述目标数据表包括多条数据记录;
计算所述目标数据表中每两个数据记录间的欧式距离;
基于计算得到的数据记录间的欧式距离及预设聚类算法对所述目标数据表进行聚类操作,以将所述目标数据表的数据记录聚成多个簇;
判断每一所述簇中包含的数据记录的数目是否符合预设数目要求;
若存在不符合所述预设数目要求的簇,则对不符合所述预设数目要求的簇进行数目调整;
对每一所述簇中的数据记录的属性进行泛化处理,以将每一所述簇转化为K匿名簇,及将所述K匿名簇的数据记录以数据表形式存储于隐私数据库中;
接收请求方的数据共享请求,并从所述隐私数据库中筛选出储存有所述数据共享请求所请求共享的目标属性的数据表;及
将筛选得到的数据表中包含所述目标属性的簇的泛化属性值共享给所述请求方。
2.如权利要求1所述的方法,其特征在于,所述数据表的属性包括敏感属性与非敏感属性,所述对原始数据库的每一数据表的属性进行预处理,以得到多张属性相关度排序在预设位之前的目标数据表的步骤包括:
将所述数据表的敏感属性划分为第一集合,将所述数据表的非敏感属性划分为第二集合;
计算所述第一集合中各敏感属性之间的相关度,以根据计算得到的相关度及预设中心点聚类算法对所述敏感属性进行分组;及
基于每一所述数据表的敏感属性的相关度进行排序,以得到多张属性相关度排序在所述预设位之前的数据表作为所述目标数据表。
3.如权利要求2所述的方法,其特征在于,所述计算所述第一集合中各敏感属性之间的相关度,以根据计算得到的相关度及预设中心点聚类算法对所述敏感属性进行分组步骤包括:
计算所述第一集合中每两个敏感属性之间的克莱姆相关系数;
根据计算得到的克莱姆相关系数计算得到所述第一集合中每两个敏感属性之间的属性距离;及
根据计算得到的属性距离及预设中心点聚类算法对所述第一集合中各敏感属性进行分组。
4.如权利要求3所述的方法,其特征在于,所述克莱姆相关系数的计算公式为:其中V为所述克莱姆相关系数,R、C分别为该两个敏感属性的枚举数值,n为所述数据表的数据记录总数,X2为Pearson卡方统计量,若计算得到的V值越靠近1,表明该两个敏感属性的相关性越强,若计算得到的V值越靠近0,表明该两个敏感属性的相关性越弱,所述属性距离的计算公式为:D=1-V。
5.如权利要求1所述的方法,其特征在于,所述计算所述目标数据表中每两个数据记录间的欧式距离的步骤包括:
利用Gower’s系数度量所述目标数据表中两个数据记录的标准化值;及
基于度量得到的该两个数据记录的标准化值及预设欧式距离算式计算所述目标数据表中该两个数据记录间的欧式距离;
其中,所述预设欧式距离算式为:其中D(x,y)为该两个数据记录间的欧式距离,xi为第一个数据记录的标准化值,yi为第二个数据记录的标准化值,n为所述数据表的数据记录总数。
6.如权利要求1所述的方法,其特征在于,所述预设数目要求为k条数据记录,所述方法还包括:
计算每个预选k值对应的轮廓系数;及
从多个所述轮廓系数中选择最大的轮廓系数所对应的预选k值作为最终k值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910977136.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通信终端及处理方法
- 下一篇:外部数据共享管理平台