[发明专利]大数据环境下保护用户隐私的数据管理方法在审
申请号: | 201711396987.3 | 申请日: | 2017-12-21 |
公开(公告)号: | CN107886010A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 范永;朱朝阳;周亮;王晓蓉;王新迎 | 申请(专利权)人: | 中国电力科学研究院有限公司;国网江苏省电力公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京工信联合知识产权代理有限公司11266 | 代理人: | 郭一斐 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 环境 保护 用户 隐私 数据管理 方法 | ||
技术领域
本发明涉及数据库管理的技术领域,尤其是指一种大数据环境下保护用户隐私的数据管理方法。
背景技术
大数据是一种战略资源,在当今社会和经济发展中发挥着越来越重要的作用,优化大数据环境可以为企业等带来巨大的经济效益。随着大数据技术的发展,电力企业迫切希望利用大数据技术挖掘自身电力数据的价值,为指导业务发展提供服务和支撑。
近年来,在《网络安全法》发布后,国家把公民个人隐私的保护提高到了法律的高度,公民的个人信息已构成了大数据的一个重要部分,因此对目前大数据业务的开展带来了很大的冲击。由于在大数据应用中,所有用户数据都保存在“大数据平台”中,以供分析比对。这种操作方式使得不同的数据所有者(电力企业的各业务部门)失去了对各自业务数据的“控制”能力,难以贯彻对用户隐私保护的承诺。而大数据平台也很难应对多家数据所有者的数据保护要求。
为了克服上述问题,现有中国发明专利(CN106254389A)公开了一种大数据安全管理方法及系统,包括:接收用户数据以及隐私设定需求,根据用户数据的来源生成该用户数据相应的用户标识;所述用户数据包括若干个逻辑模块;根据隐私设定需求对相应的逻辑模块进行加密;接收用户端的访问请求,访问请求包括筛选条件;从所有用户数据中筛选出符合筛选条件的用户数据为目标数据;将该目标数据所对应的用户标识匿名为匿名标识;将该匿名标识和目标数据发送至用户端。上述根据用户需求对部分逻辑模块进行加密,将用户隐私数据进行隐藏,并且对发送给用户端的用户标识进行匿名,因此避免了个人信息公开流通,但是这种加密的方式往往会对数据分析造成影响,使大数据分析结果“失真”,从而影响大数据分析的效果。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中在保护隐私数据的同时影响大数据分析效果的问题从而提供一种有效保护用户隐私数据且保证大数据分析效果的大数据环境下保护用户隐私的数据管理方法。
为解决上述技术问题,本发明的一种大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,包括如下步骤:步骤S1:明确原始数据库中需要隐藏的用户隐私数据;步骤S2:将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;步骤S3:将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用。
在本发明的一个实施例中,所述隐私保护表中,将存在隐私数据的相关列的字段类型设置为varchar变长字符类型。
在本发明的一个实施例中,所述隐私保护数据库中建立随机值表,且所述随机值表中存储系统随机产生的多位字符。
在本发明的一个实施例中,所述多位字符的位数根据需要自行设定。
在本发明的一个实施例中,所述随机值表定期更新,用新的随机值替换所述隐私保护表和所述隐私对应表中的随机标识。
在本发明的一个实施例中,所述隐私数据保护库中替代隐私数据的随机值由系统按照顺序从所述随机值表中选取。
在本发明的一个实施例中,所述随机值由系统按照顺序从所述随机值表中选取时,在同一数据库中的随机值表中的随机标识循环使用。
在本发明的一个实施例中,所述隐私保护表允许自由访问,所述隐私对应表只允许业务部门访问。
在本发明的一个实施例中,所述业务部门对数据分析员提出的查询请求采取以下三种响应方式:拒绝反馈用户隐私数据;反馈用户隐私数据;仅反馈对隐私数据的处理结果。
在本发明的一个实施例中,所述数据分析人员通过所述原始数据库直接访问各个隐私保护数据库中的公开数据和所述隐私保护表,并在资源池中对数据进行处理。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的大数据环境下保护用户隐私的数据管理方法,在大数据应用的背景下,利用隐私数据和随机数据与隐私数据相对应的隐私对应表保护用户隐私数据,通过保护所述隐私对应表实现对隐私数据的保护,并为业务数据的所有者保留其对数据的管理权限提供了一种有效的解决方案。
在保证大数据分析效果的同时,本发明通过将原始数据库中重要用户的隐私数据转化为无意义的随机数据标识实现对用户隐私的保护,其中无意义的随机数据标识可隐藏用户隐私;通过将随机数据标识进行动态更新,防止用户隐私被通过推理的方式泄露。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国网江苏省电力公司,未经中国电力科学研究院有限公司;国网江苏省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711396987.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置