[发明专利]一种隐私保护的k-means聚类方法有效
申请号: | 201711446923.X | 申请日: | 2017-12-27 |
公开(公告)号: | CN108154185B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 赵冬冬;胡小意;向剑文 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明涉及一种基于负数据库的隐私保护k‑means聚类算法,包括:将所需要进行聚类的数据库中X的每一条数据转化为二进制串,并通过K‑hidden算法对每一个二进制串生成相应的负数据库;随机生成k个不同的二进制串作为初始聚类中心;对于每一个负数据库 |
||
搜索关键词: | 一种 隐私 保护 means 方法 | ||
【主权项】:
一种隐私保护的k‑means聚类方法,其特征在于,包括:步骤1:将所需要进行聚类的数据库中X的每一条数据xi(xi∈X)转化为长度为m的二进制串,并对每一个二进制串生成相应的负数据库,记为步骤2:使用random函数随机生成k个长度为m的不同的二进制串作为初始聚类中心;步骤3:对于每一个负数据库分别计算到每个聚类中心的欧氏距离,把划分给距离其欧氏距离最近的聚类中心,具体包括:在K‑NDB中,每个字符串有K个确定位,i类型的字符串有i(i∈{1...K})位与原始串s不同,pi是生成i类型的字符串的概率,NDBs中有m×r条二进制串,所有确定位的个数为K×m×r,其中与原字符串不同的确定位的个数为所以,对于一个二进制串s和它所对应的负数据库NDBs,NDB中的每一个二进制串与s在每一个确定位上不同的概率为: 定义三个事件:事件A:原字符串s的第i位为‘0’;事件B:原字符串s的第i位为‘1’;事件C:在NDBs中,第i位上有a个‘0’和b个‘1’;根据贝叶斯公式,、得出原字符串在第i位为‘0’的概率(q0),即P(A|C)为: 其中,原字符串s第i位为‘0’和为‘1’的概率相等,即P(A)=P(B)=1/2,并且得到NDB中每一个二进制串与s在某一位不同的概率Pdiff,和每一个二进制串与s在某一位上相同的概率Psame=1‑Pdiff,所以可以求出原字符串在第i位为‘0’的概率q0为: 根据上式原字符串s上每一位为1的概率,和s取值的概率,对于两个二进制串s和t,定义s是一个隐藏串,t是一个实时串,计算负数据库NDBs到二进制串t的公式为: 其中,Qi代表s取值为i的概率;对于每一个根据上述欧氏距离估算公
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711446923.X/,转载请声明来源钻瓜专利网。
- 上一篇:人格类型确定方法及装置
- 下一篇:一种模式识别方法和装置