[发明专利]一种处理负调查中不合理数据的方法有效
申请号: | 201710267513.2 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107145539B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 赵冬冬;方舒;向剑文 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G16H10/20;G16H50/70 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 调查 不合理 数据 方法 | ||
本发明公开了一种处理负调查中不合理数据的方法,包括如下四个步骤:计算正调查的值;将不合理的数据进行调整;对于调整后的数据,计算由调整造成的差值分配到其他选项的比例;对于调整后得到的负调查的值,计算正调查的值等;在负调查重建正调查数据的过程中,本发明既可以处理负值这一类不合理的数据,也可以处理与背景知识相违背的不合理数据,并且取得较高的重建精度。
技术领域
本发明属于隐私保护技术领域,涉及一种负调查重建正调查数据的方法,具体涉及一种传统的重建算法出现不合理数据时的处理方法。
背景技术
信息大爆炸的时代,人们逐渐意识到个人隐私安全的重要性。为了满足人们日益增长的隐私保护的需求,越来越多的隐私保护的方法被提出,负调查就是其中的一种。负调查是信息负表示的一种应用,与传统调查相比,它可以有效的保护参与者的隐私,特别适用于敏感数据的收集。在传统的正调查中,不论是否涉及到敏感数据,参与者都需要选出符合自己实际情况的那个选项,而负调查与传统的正调查相反,参与者被要求在不符合自己实际情况的选项中选择一项。
负调查收集到的数据,并不是我们所需要的数据,我们需要的是从负调查重建出来的正调查的数据。目前大多的重建算法都是针对均匀负调查提出的,均匀负调查是指算法假设参与者是以等概率的可能性选择负选项。NStoPS重建算法是均匀负调查最基本的重建算法,但是NStoPS算法在重建的结果中可能出现负值,负值是不符合实际情况的,所以属于是不合理的数据。随后,针对负值问题,在NStoPS基础上提出了两种改进算法,称为NStoPS-I、NStoPS-II。虽然这两种算法可以很好的处理负值问题,但是NStoPS-I迭代速度慢,效率低,NStoPS-II不适用于选择概率为任意分布的负调查。
现实中的调查问卷往往是存在一些背景知识的,比如对于某些疾病的调查,医院往往知道该疾病的发病概率等。若将背景知识引入到负调查中,采用传统的重建算法,会出现与背景知识相违背的不合理数据。针对这类不合理数据,NStoPS-BK算法被提出,该算法证明了合理的利用背景知识可以有效的提高数据重建的精度。
负调查要求随机选择一个不符合自己情况的选项,调查过程中也可能存在人为偏好,这些都有可能造成负调查重建正调查数据时出现不合理的数据。显然,这些不合理的数据会影响重建正调查数据的精度,所以,合理的处理重建算法中的不合理数据对于提高数据重建精度非常重要。
发明内容
为了解决上述技术问题,本发明提供了一种处理负调查中不合理数据的方法。
本发明所采用的技术方案是:一种处理负调查中不合理数据的方法,其特征在于,包括以下步骤:
步骤1:计算正调查的值;
步骤2:将不合理的数据进行调整;
步骤3:对于调整后的数据,计算由调整造成的差值分配到其他选项的比例;
步骤4:步骤4:根据步骤3中得到的比例对负调查的值进行调整,对于调整后的负调查的值,计算对应的正调查的值。
作为优选,步骤1中,采用传统的NStoPS重建算法计算正调查的值为其中,表示正调查中选项i的人数比例估计值,i=1、2、...、c;
作为优选,步骤2中,将不合理的数据进行调整,调整后负数据和正数据的关系为:
其中,ri表示负调查中每个选项的人数比例,xi表示调整后正调查的人数比例,并且r1+...+rc=1,X1+...+Xc=1,Δri表示调整不合理的数据所带来的差值,pij代表在正调查中选择选项i的人在负调查中选择了选项j的概率,i=1、2、...、c,j=1、2、...、c;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710267513.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种髋关节置换手术用体位固定器械
- 下一篇:一种电缆收线架
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置