[发明专利]一种负调查实施和重构正数据的方法有效
申请号: | 201710278980.5 | 申请日: | 2017-04-25 |
公开(公告)号: | CN107145974B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 赵冬冬;吴建国;向剑文;叶璐瑶 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 调查 实施 重构正 数据 方法 | ||
本发明涉及一种负调查实施和重构正数据的方法,包括:按负调查的形式实施负调查,同时抽取少量的样本实施对应负调查题目的正调查;统计数据,得到各个选项负选的矩阵以及总样本数;对做了正负两个调查的少量样本做关联分析,得到重构矩阵;按负调查的矩阵约束条件,调整重构矩阵;运用最大似然估计和负调查的约束条件得到最优化的重构结果。本发明以背景知识和事件最大似然估计为基础,提出了一种负调查实施与重构方法,可以为负调查真实应用的方式提供参考,同时可以提高负数据重构的准确性。
技术领域
本发明属于隐私保护与安全领域,具体涉及一种基于背景知识来实施负调查并基于最大似然估计来重构正数据的方法。
背景技术
随着计算机网络和大数据的飞速发展,日常生活中人们接触到各种海量的数据和信息,这虽然在某些方面给人们带来了便利,但在一定程度上也造成了各种隐私数据的泄露。因此,保护人们的隐私显得越来越重要。信息的负表示是一种有效保护隐私的数据表示方式,而负调查起源于信息的负表示。
在传统的问卷调查(正调查)中,参与者被要求选择他属于的选项(正选项),因此收集的数据属于参与者的真实数据(正数据)。而在负调查中,参与者被要求在他不属于的选项中任选一项。例如:你每月的工资是多少?A:3000B:3000-5000C:5000-8000D:8000。如果参与者的工资为6000,那么在正调查中他应该选C,而在负调查中,他应在A、B或D中任选一项。负调查要求选项数大于等于三,因而对于敏感的问题,采用负调查的方式可以在一定程度上保护参与者的隐私。由于参与者的真实数据不会被泄露,其也更愿意提供真实答案,这样可以在一定程度上使收集的数据更加真实。
负调查的研究还处于起步阶段,其关键问题在于从负数据到正数据的重构上,已有的方法(NStoPS、NStoPS-I、NStoPS-II等)虽然可以得到结果,但是它们只适用于均匀分布,是理论上的重构方法,并没有经过手动选择的真实数据的检验,因而可能并不适用于真实负调查。
虽然负调查从提出到现在经历了十余年的发展,研究负调查的学者越来越多,但是负调查的研究始终停留在理论和应用验证阶段。大部分负调查工作都只是用计算机模拟了负调查,少部分工作,虽然进行了真实负调查,但是主要通过设计程序来进行负选,并不是人手动选的。
目前研究者提出的选项被选的模型服从均匀分布、高斯分布等理想状态,但在真实的负调查中可能并非如此,因而在负调查中每个选项被选的概率有待调整,因而已有的从负调查到正调查的重构算法可能并不适合真实的负调查。
假设负调查题目的选项数为c,参与负调查的人数为n,本应属于第i个选项的人选择第j个选项的概率为qij,则重构矩阵为假设负调查的结果为r=(r1…rc),rj表示在负调查中选择第j个选项的概率,则t=rQ-1为重构后的正数据,tj表示在正数据中选择第j个选项的人数。
因此,一种实施负调查的方式和更为精确的负调查重构方法是负调查领域十分关键的问题。
发明内容:
为了解决上述背景技术中提到的问题,本发明提出了一种基于背景知识的负调查实施和基于最大似然估计的重构正数据方法。
为了解决上述技术问题本发明的所采用的技术方案为:
一种负调查实施和重构正数据的方法,其特征在于,包括:
步骤1:根据负调查的形式和要求的负调查问卷题目、负调查问卷题目对应的正调查问题,正调查问题对应的若干选项的问题答案,根据负调查题目实施负调查,同时抽取设定数量的样本实施对应负调查题目的正调查。设定数量为少量的样本,抽取少量的样本做对应正调查是为了尽量保护用户的隐私,理论上后者的份数N越大得到的重构结果越准确。数量由用户自行设定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710278980.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用便携式汽车转向器壳体安装孔位置度检具
- 下一篇:一种止退耳机座
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置