[发明专利]基于差分隐私的用户数据匿名编码方法及装置在审
申请号: | 202110563065.7 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113177231A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 黄思创;鲁金彪;陆杰文;罗鹏飞 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 孙乳笋;刘熔 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 用户 数据 匿名 编码 方法 装置 | ||
本发明属于大数据技术领域,本发明提供了一种基于差分隐私的用户数据匿名编码方法及装置,基于差分隐私的用户数据匿名编码方法包括:根据接收的用户数据生成随机序列;根据所述随机序列对所述用户数据进行编码,以生成比特向量;根据所述比特向量对编码后的用户数据进行差分隐私处理。本发明扩充了比特向量编码方案的特性,使其能应用于数据发布的场景。在保护用户隐私的前提下,使得针对数据量大的应用场景估计误差较小,在数据量大的应用场景有很高的实用性。
技术领域
本发明属于大数据技术领域,具体涉及一种基于差分隐私的用户数据匿名编码方法及装置。
背景技术
众所周知,差分隐私是针对统计数据库的隐私泄漏提出的一种新的隐私定义。某条记录在或者不在数据集中,对计算结果的影响是微乎其微的。因此,一条记录添加到数据集中所引起的隐私泄漏风险被控制到非常小且在可接受的范围内,并且攻击者不能通过观察计算结果而获得准确的个人信息。与传统的隐私保护模型相比,差分隐私保护模型有两个显著的优点:
第一:差分隐私对攻击者拥有的背景做了最严格的定义,即使攻击者掌握了除了要保护的信息以外的所有相关的背景知识,也依然能保护用户的个人信息。
第二:差分隐私建立在坚实的数学基础上,对隐私保护进行了严格的定义并提供了量化评估的方法,使得数据集在不同参数处理下所提供的隐私保护水平具有可比较性。由于差分隐私既克服了加密技术带来的计算复杂度的问题,又克服了K-ANONYMITY及衍生的匿名隐私保护技术中攻击者背景知识假设不严格的各种攻击问题。因此自差分隐私保护模型提出以来,就被相关业界人员认可并迅速成为隐私保护领域中的研究热点。
但在实际应用中想要找到一个真正可信的第三方数据收集平台十分困难,这极大地限制了中心化差分隐私技术的应用。鉴于此,在不可信第三方数据收集者的场景下,本地化差分隐私(LOCAL DIFFERENTIAL PRIVACY)技术应运而生,其在继承中心化差分隐私技术定量化定义隐私攻击的基础上,细化了对个人敏感信息的保护。具体来说,其将数据的隐私化处理过程转移到每个用户上,使得用户能够单独地处理和保护个人敏感信息,即进行更加彻底的隐私保护。
如何在有效利用数据给人类提供便利服务的同时,并能使个人隐私信息能够得到有效的保护,是目前急需解决的问题。
发明内容
本发明属于大数据技术领域,针对现有技术中的问题,本发明扩充了比特向量编码方案的特性,使其能应用于数据发布的场景。在保护用户隐私的前提下,使得针对数据量大的应用场景估计误差较小,在数据量大的应用场景有很高的实用性。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种基于差分隐私的用户数据匿名编码方法,包括:
根据接收的用户数据生成随机序列;
根据所述随机序列对所述用户数据进行编码,以生成比特向量;
根据所述比特向量对编码后的用户数据进行差分隐私处理。
一实施例中,所述根据接收的用户数据生成随机序列,包括:
将预接收的用户数据划分为目标均匀分布数据;
根据所述目标均匀分布数据以及所述用户数据生成所述随机序列。
一实施例中,所述根据所述目标均匀分布数据以及所述用户数据生成所述随机序列,包括:
对所述用户数据进行列置换,以生成列置换后的用户数据;
根据所述目标均匀分布数据以及所述列置换后的用户数据生成所述用户数据的随机序列。
一实施例中,基于差分隐私的用户数据匿名编码方法还包括:根据差分隐私处理后的用户数据计算所述用户数据对应的直方图发布K。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110563065.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种厨卫间止水带安装结构及安装方法
- 下一篇:无线智能水表生产设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置