[发明专利]一种基于深度学习的大数据隐私保护方法在审
申请号: | 202110507079.7 | 申请日: | 2021-05-10 |
公开(公告)号: | CN113158252A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 江耀;刘东升 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N20/00 |
代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 薛晓军 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 数据 隐私 保护 方法 | ||
本发明公开了一种大数据领域及计算机领域基于深度学习的大数据隐私保护方法,该方法的具体步骤如下S1通过众包方式采集用户数据;S2将采集的用户数据存入云数据库并进行格式统一;S3利用深度学习算法训练出一个特征提取器;S4对特征提取器设置变量因子λ并调整λ数值得到最优解;S5利用训练好的最优λ特征提取器从原始数据中提取特征;S6数据搜集器模块汇总提取后的数据中间表征。本发明通过提出来一个可以提供隐私保护的数据特征提取器,保证从数据中提取出的特征尽可能少的包含所需要保护的隐私信息,满足隐私安全性需求;同时保证提取的中间特征尽可能多的保留有效的信息,防止大数据时代用户个人信息被滥用。
技术领域
本发明涉及大数据领域以及计算机技术领域,公开了大数据领域一种基于深度学习的大数据隐私保护方法。
背景技术
一方面随着科技的发展,大数据行业发展空前繁荣,但是近年来,各种信息泄露事件频繁发生,引发广泛社会关注。数据共享的时代背景下,如何在数据收集过程中加强隐私保护,防止个人信息被滥用,俨然已成为重要研究课题。,另一方面,计算机技术的发展,深度学习技术日益成为人工智能行业的主流。但深度学习技术依赖大数据集,既需要通过数据集提取特征来学习训练出高效的模型,也需要大量数据集来检验模型的效果。为了平衡大数据特征提取的有效性和个人隐私泄露之间的矛盾,我们提出了一种基于深度学习的大数据隐私保护方法投入使用,以解决上述问题。
发明内容
解决的技术问题
针对现有的大数据时代用户信息泄露严重,个人隐私保护难的情况,本发明的目的在于提供一种基于深度学习的的大数据隐私保护方法,具备在保证用户个人隐私信息不被泄露的同时兼顾数据集特征提取的有效性等优点,以解决上述背景技术中提出的问题。
本发明的技术方案如下:一种基于深度学习的大数据隐私保护方法包括应对众包数据采集模块、云数据库存储模块、特征提取器模块、数据搜集器模块。
所述众包数据采集模块,通过产业众包平台、个人分包、企业分包等形式搜集企业机构或个人的原始信息数据,其中包括但不限于文本、音频、视频等形式。
所述云数据库存储模块,根据上述规则每条收集到原始大数据信息进行规则划分,其划分包括对相似信息进行格式化统一分存入相应云数据库中,使业务者能够更快地理解和处理信息。
所述特征提取器模块,利用深度学习技术训练出一个特征提取器,将得到的原始大数据输入特征提取器中,提取出任务需要的数据有效特征。
所述数据搜集器模块,根据从原始数据中提取到的特征检验其有效性,将无效特征剔除,将剩余的有效特征提取。
优选的,云数据库存储系统采用安全性高,高并发量,动态获取延时低的AWS或Oracle。并通过大数据的分析、统计以及常规习惯将信息进行预先处理,采用第三方工具Matplotlib或finebi。
优选的,所述特征提取器模块通过引入可控参数λ来表示效用-隐私平衡因子,将特征有效性最大化和个人隐私泄露最小化两个目标结合起来,得到最终的目标函数。
优选的,所述数据搜集器模块无需传输原始数据,利用收集到的中间表征来训练深度学习DNN模型,保证无法逆向还原出准确的受保护隐私信息,这使得任何人无法从原始数据中获取用户个人隐私信息。
有益效果
与现有技术相比,本发明的有益效果是:通过上述技术方案本发明提供的一种基于深度学习的大数据隐私保护方法,学习一个特征提取器,隐藏中间表征中的隐私信息,同时最大限度地保留原始数据中嵌入的原始信息,以供数据收集器完成未知的学习任务。与现有的表示学习和对抗学习法相比在安全性和通用性上领先,达到数据特征学习效果和隐私保护两方面的相对平衡。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110507079.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置