[发明专利]基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质在审
申请号: | 202011511006.7 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112580097A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 朱娜斐;陈宝存;何泾沙;靳姝婷;潘世佳 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 林聪源 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 推理 用户 隐私 数据 保护 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质,属于信息安全技术领域,获取用户已经公开的数据;对数据进行预处理,提取关于用户的个人信息;将个人信息或隐私信息一一映射到语义网内的节点上,遍历计算目标节点到已知节点的所有路径;如果已知节点的隐私泄露值以及已知节点到目标节点路径的权重值均是已知的,则根据已知节点的隐私泄露值和已知节点到目标节点路径的权重值计算目标节点的隐私泄露值;用户根据隐私泄露值判断是否公开隐私信息;若用户选择公开,则将隐私信息添加到公开数据中。本发明提升用户对于自己隐私信息的控制权。
技术领域
本发明属于信息安全技术领域,特别涉及一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质。
背景技术
现有的隐私保护技术大都停留在理论研究层面,传统的k-匿名、l-多样性等等这些隐私保护方法,主要对用户的标识符、准标识符等进行不同程度的匿名或者泛化等预处理操作,从而当这些互联网公司在出于科学研究等目的,向外公开这些用户数据集时,可以起到一定程度的隐私保护的效果。但这都有一个重要的前提,那就是用户认为这些互联网是完全可信的,除非其主动泄漏,否则不会产生隐私泄露,这显然是不太合理的。同时,由于现阶段用户的信息散布在各个平台之上,没有一个统一的用户信息管理。因此,对于已经向互联网公布了哪些个人信息,有哪些隐私已经造成了泄漏,有哪些隐私信息正在面临着泄漏的风险,用户都没有一个直观的了解,因此无法很好进行个人隐私信息的保护。
发明内容
针对上述存在的问题,本发明提供一种基于语义推理的用户隐私数据保护的方法、装置、电子设备及存储介质。
一种基于语义推理的用户隐私数据保护的方法包括:
获取用户已经公开的数据;
对所述数据进行预处理,提取关于所述用户的个人信息;
将所述个人信息一一映射到语义网内的节点上,所述节点为已知节点;
将所需判断的隐私信息映射到所述语义网内的节点上,所述节点为目标节点;
遍历计算所述目标节点到所述已知节点的所有路径;
如果每一条所述路径的隐私泄露权重值已知,则将所有所述路径的隐私泄露权重值相加,计算得到所述目标节点的隐私泄露值;
所述用户根据所述隐私泄露值判断是否公开所述隐私信息;
若所述用户选择公开所述隐私信息,则将所述隐私信息添加到所述公开的数据中。
优选的是,所述对所述数据进行预处理,提取关于所述用户的个人信息的步骤包括:
采用自然语言处理技术将所述数据中的个人信息提取出来;
并对所述个人信息进行语义消歧。
优选的是,所述语义网的构建步骤:
从词典中获取符合上下位关系、实例关系、整体部分关系和属性关系的名词和形容词;
利用所述名词和形容词构建所述语义网。
优选的是,将所述个人信息或隐私信息一一映射到语义网内的节点上,包括:
用向量空间模型VSM算法计算所述个人信息和所述隐私信息与所述每一个节点相对应的关键词的语义相似度;
如果所述语义相似度不为零,则将所述个人信息和所述隐私信息与每一个节点进行映射;
如果所述语义相似度为零,则使用余弦相似度算法计算待映射的所述个人信息和所述隐私信息与每一个节点相对应的关键词的词语相似度;
如果所述词语相似度大于预定阈值,则将所述个人信息和所述隐私信息与每一个节点进行映射。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011511006.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电池保护电路及装置
- 下一篇:一种区块链跨链交易去重的方法及装置