[发明专利]一种有监督矩阵补全的隐私保护方法在审
申请号: | 202011165155.2 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112364372A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 彭松;肖迪 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G06N3/04;G06F17/16 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 武君 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 矩阵 隐私 保护 方法 | ||
本发明公开了一种有监督矩阵补全的隐私保护方法,包括:S1:根据当前恢复的补全矩阵,获得达到具有最大化的有效性同时具备最小隐私泄露的判别信息及其投影矩阵;S2:基于有监督矩阵补全技术,定义矩阵补全的优化式,将判别信息引入到补全信息,获取矩阵补全和最佳的投影矩阵;S3:将补全的数据进行有损的压缩投影。本发明,同时考虑了数据集补全中的标签信息还考虑了矩阵的隐私,因此矩阵补全的方法能够进一步的提高恢复后矩阵数据的效用性和隐私性,从而通过有损的压缩的方法将其放入漏斗状的神经网络进行效用类别的预测,还能保证隐私类别不能不被预测出,能够为缺失数据补全和用户的数据隐私提供一种可靠的方法。
技术领域
本发明涉及智能隐私保护与网络安全领域,具体的,涉及一种有监督矩阵补全的隐私保护方法。
背景技术
对于大数据和智能信息时代,越来越多的数据被收集的同时收集的数据也存在着噪声、失真和数据缺失的问题,基于这两个问题将缺失的数据进行有监督的压缩隐私矩阵补全不仅可以提高数据的效用性还能提升数据的隐私安全。
在大数据时代,越来越多的网络数据被收集,这就使得大量数据存放在云环境中。由于现在的数据挖掘工具越来越强大,极有可能导致数据隐私被挖掘甚至被泄露的问题。同时,在收集数据的过程中想要收集到完整的数据也是很困难的,需要耗费很大的人力物力。
专利文献CN108537738A一种矩阵补全方法,涉及基于低秩近似的高精度的矩阵补全方法,一种方式是通过采集部分信号来加速数据采集。从这些数据的低秩特性出发来恢复出完整的信号,首先利用逼近函数来近似计算矩阵的秩,然后建立矩阵缺失信号的重建模型,最后通过迭代算法重建信号。重建的矩阵精度高,易于操作,可以从少量数据中恢复出完整信号。但是该矩阵补全的方法仅仅考虑的是矩阵数据的本身没有考虑到待补全数据的标签信息,以及补全数据的隐私问题,该方法也没有考虑到补全后的矩阵是否补全的矩阵的可用性是否下降。
发明内容
有鉴于此,本发明的目的是提供一种基于有监督矩阵补全的隐私保护方法,考虑了数据集补全中的标签信息还考虑了矩阵的隐私,能够为缺失数据补全和用户的数据隐私提供一种可靠的方法。
本发明的目的是通过以下技术方案实现的:
一种有监督矩阵补全的隐私保护方法,隐私保护方法包括:
S1:根据当前恢复的补全矩阵,获得达到具有最大化的有效性同时具备最小隐私泄露的判别信息及其投影矩阵;
S2:基于有监督矩阵补全技术,定义矩阵补全的优化式,将判别信息引入到补全信息,获取矩阵补全和最佳的投影矩阵;
S3:将补全的数据进行有损的压缩投影。
进一步,所述S1具体为:
S11:获取当前恢复的补全矩阵的散度矩阵SW和类间的散度矩阵SB;
散度矩阵SW表示为:
其中:i代表类标签,L代表数据集中总的类别数,其中j代表第i类的第j个样本,Ni代表第i类中总的样本数,代表第i类的第j个样本,ui表示第i类样本的均值;
类间散度矩阵SB表示为:
其中:i代表类标签,L代表数据集中总的类别数,ui表示第i类样本的均值,u表示样本矩阵中的均值;
S12:结合类内的散度矩阵SW和类间的散度矩阵SB获得具有最大化的有效性同时具备最小隐私泄露的目标函数,具体为:
其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011165155.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种残压检测电路及检测方法
- 下一篇:一种二氧化碳水合物饼连续制备装置