[发明专利]一种基于采样的差分隐私保护方法和系统在审
申请号: | 201910975518.X | 申请日: | 2019-10-15 |
公开(公告)号: | CN110727957A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 周世杰;廖永建;黄文;向麟;陈鼎伟;胡凤仙;王鹤鸣;黄铭 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 51214 成都九鼎天元知识产权代理有限公司 | 代理人: | 管高峰 |
地址: | 611731 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私保护 临时数据库 查询请求 查询 原始数据库 混淆 答案返回 个人用户 海量数据 接收查询 数据特征 数据形成 数据噪声 随机采样 答案 统计分析 采样 数据库 | ||
本发明公开了一种基于采样的差分隐私保护方法和系统,所述方法包括:步骤1,收集个人用户的数据形成原始数据库;步骤2,对原始数据库中的数据进行随机采样得到临时数据库;步骤3,接收查询用户的查询请求q;步骤4,根据查询请求q涉及数据的数据特征选择差分隐私保护机制;步骤5,在临时数据库中运行选择的差分隐私保护机制,使差分隐私保护机制在临时数据库中查询查询请求q的真实答案;步骤6,利用数据噪声混淆所述真实答案;步骤7,将混淆后的真实答案返回给查询用户。本发明中查询用户可以对海量数据进行统计分析;查询用户不能获得数据库中任何用户的具体信息;能够加强已有差分隐私保护方法的隐私保护强度。
技术领域
本发明涉及隐私保护领域,尤其涉及一种基于采样的差分隐私保护方法和系统。
背景技术
随着移动设备、智能终端、传感器等网络和通信技术的高速发展,人类社会的数据种类和规模正在前所未有的速度増长,如此大规模、高维度、多样化的数据潜藏有丰富的信息和知识,俨然成为一种具有巨大经济价值和社会价值的资源。由于在这些海量的数据中蕴含着潜在的、有价值的信息,吸引了来自学术界、工业界及政府部门等对大数据研究的热潮。在学术界,2008年,nature出版了专刊“big data”,在诸多方面介绍了海量数据带来的挑战。science则在2011年推出专刊“dealing with data”,讨论了数据洪流所带来的机遇.在各国政府层面,2012年3月,美国政府发布了“大数据研究和发展倡议”,该计划旨在提高从海量和复杂的数据中获取知识的能力。
大数据的收集、发布在带来巨大益处的同时,也给个人的隐私保护带来了巨大的挑战。各行各业存储的海量数据,往往包含个人隐私信息。当需要发布这些包含个人敏感信息的数据时,隐私就成了一个重要的、必须面对的问题。许多机构在有意无意的泄露用户的信息。比如,伍斯特理工学院曾经报道过2010至2012年网站泄露用户隐私的消息;苹果公司和谷歌公司承认利用PC、智能手机收集用户地理位置信息,涉嫌侵犯用户隐私;美国在线曾经发布使用者的查询日志,但由于可以锁定具体的查询者,很快就删除了查询日志。
对大数据发布隐私保护的技术研究,对于隐私保护和数据分析技术都具有重要意义。诚然,在实践中,可以依靠制定政策方针或商定协议等非技术手段来保障数据属主的个人隐私。但是,此类非技术手段极度依赖参与者和权威中心的置信度,这种要求在如今多元化的场景中是不实用的。使用隐私保护的数据发布技术,设计、开发一种隐私保护的数据发布工具,使得即使在更加不利的环境条件下个人的隐私依然能够得到保护,而数据的效用也能够得到保证。这将解决大规模数据收集的最大障碍之一,使得数据使用更加方便,最终将有力的促进数据分析、挖掘研究的进步,产生巨大的社会经济效益。
发明内容
本发明所要解决的技术问题是:提供一种基于采样的差分隐私保护方法和系统,使得查询用户能够获得海量数据的统计信息,但不能获得任意单个用户的信息,保证在进行机器学习等各种数据分析的同时,个人隐私信息不被泄露;同时基于采样的差分隐私保护方法,能够基于现有的差分隐私保护方法,构建出隐私保护强度更高的差分隐私保护方法,即能够加强现有差分隐私保护方法的隐私保护强度。
本发明提供的一种基于采样的差分隐私保护方法,包括如下步骤:
步骤1,收集个人用户的数据形成原始数据库;
步骤2,对原始数据库中的数据进行随机采样得到临时数据库;
步骤3,接收查询用户的查询请求q;
步骤4,根据查询请求q涉及数据的数据特征选择差分隐私保护机制;
步骤5,在临时数据库中运行选择的差分隐私保护机制,使差分隐私保护机制在临时数据库中查询查询请求q的真实答案;
步骤6,利用数据噪声混淆所述真实答案;
步骤7,将混淆后的真实答案返回给查询用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910975518.X/2.html,转载请声明来源钻瓜专利网。