[发明专利]一种数据处理方法及装置有效
申请号: | 202110339521.X | 申请日: | 2021-03-30 |
公开(公告)号: | CN113032399B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 赵子润;余恪平;林昭文;孙溢 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/245;G06F16/27;G06F21/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明实施例提供了一种数据处理方法及装置,当接收到针对目标属性的查询请求时,从预设存储空间中的各数据表单中,确定查询请求所请求的时间段对应的数据表单,作为第一数据表单;确定第一数据表单的差分预算;获取目标属性针对第一数据表单的优先级值、访问次数和数据量级;基于第一数据表单的差分预算、目标属性针对第一数据表单的优先级、访问次数和数据量级,确定目标属性的差分预算;按照目标属性的差分预算,在目标属性针对第一数据表单的查询结果中添加噪声,得到目标查询结果。基于上述处理,可以提高在各属性的查询结果中添加的噪声的有效性。
技术领域
本发明涉及数据安全技术领域,特别是涉及一种数据处理方法及装置。
背景技术
基于w-事件型差分隐私保护技术的数据查询方法,在接收到针对目标属性的查询请求时,从多个数据表单中确定该查询请求所请求的时间段对应的数据表单,作为目标数据表单。每一数据表单中均记录有多个用户的属性,例如,用于记录人脸特征的数据表单中,针对每一人脸特征,该数据表单中记录有各用户是否具有该人脸特征。然后,计算目标数据表单的差分预算,进而,按照目标数据表单的差分预算,在目标属性针对目标数据表单的查询结果中添加噪声,得到目标属性的目标查询结果。
现有技术中,可以基于BD(Budget Distribution,预算分配)算法,计算各数据表单各自的差分预算。具体的,可以基于预设的滑动窗口,按照各数据表单生成时间的先后顺序,从各数据表单中选取相邻的前第一数目个数据表单,作为第一数据表单。然后,计算待分配的差分预算(例如,ε/2)与1/2的乘积(即ε/4),作为第一个第一数据表单的差分预算,并计算待分配的差分预算与已分配的差分预算(即第一个第一数据表单的差分预算)的差值,得到当前剩余的差分预算(即ε/4)。然后,计算第二个第一数据表单与第一个第一数据表单的MAE(Mean Absolute Error,平均绝对误差)。如果计算得到的MAE不小于预设阈值,计算当前剩余的差分预算与1/2的乘积(即ε/8),作为第二个第一数据表单的差分预算,并计算待分配的差分预算与已分配的差分预算(即前两个第一数据表单的差分预算)的差值,得到当前剩余的差分预算,计算第三个第一数据表单与第二个第一数据表单的MAE,并继续判断计算得到的MAE是否小于预设阈值,以此类推,可以确定各第一数据表单各自的差分预算。
然后,基于预设的滑动窗口,按照各数据表单生成时间的先后顺序,从多个数据表单中选取第一个数据表单后相邻的第一数目个数据表单,作为第二数据表单。此时,计算最后一个第二数据表单与其前一个第二数据表单的MAE,如果计算得到的MAE不小于预设阈值,计算各已分配差分预算的第二数据表单的差分预算的和值,作为第一和值。计算待分配的差分预算与第一和值的差值,得到当前剩余的差分预算,并计算当前剩余的差分预算与1/2的乘积,作为最后一个第二数据表单的差分预算。
然后,基于预设的滑动窗口,按照各数据表单生成时间的先后顺序,从多个数据表单中选取第二个数据表单后相邻的第一数目个数据表单,作为第三数据表单,并计算最后一个第三数据表单的差分预算,以此类推,可以确定各数据表单各自的差分预算。
可见,计算出的差分预算是与数据表单相对应的,也就是说,同一数据表单内各属性的差分预算是相同的。然而,一个数据表单中具有各属性的用户的数目是不同的,例如,具有第一属性的用户的数目较少,而具有第二属性的用户的数目较多。针对第一属性的第一查询结果和第二属性的第二查询结果,若均使用该数据表单的差分预算,对第一查询结果和第二查询结果添加噪声,则会导致对第一查询结果添加的噪声较大,导致第一属性的目标查询结果的可靠性低,或者,对第二查询结果添加的噪声较小,会导致第二属性的目标查询结果的安全性较低。现有技术的在各属性的查询结果中添加的噪声的有效性较低。
发明内容
本发明实施例的目的在于提供一种数据处理方法及装置,以提高在各属性的查询结果中添加的噪声的有效性。具体技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110339521.X/2.html,转载请声明来源钻瓜专利网。