[发明专利]一种基于知识图谱的隐私保护数据发布风险评估方法在审
申请号: | 202010139728.8 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111292008A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 王瑞锦;张凤荔;何兴高;张巍琦;唐榆程;郭鹏宇;谭琪 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F21/62;G06F16/36;G06F16/28 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 隐私 保护 数据 发布 风险 评估 方法 | ||
本发明公开了一种基于知识图谱的隐私保护数据发布风险评估方法,方法包括以下步骤:获取数据申请者提交的信息,判断基本信息是否符合规范;将数据申请者的信息映射为RDF数据集,然后转化为知识图谱中的图数据;基于知识图谱利用相关算法完成对数据申请者的基本信息风险评估、身份异常风险评估、组团欺诈风险评估、个体信用风险评估;结合所有风险评估数据,构建风险模型,对数据申请者进行风险评分;对综合风险评估的得分进行标签化,得出风险评估结论以及具体的风险项评估结果。本方案能够自动抽取数据申请者的信息并分析风险,主动防护隐私保护数据发布的过程,大量减少了人工审核的工作量,更直观的描述了隐私保护数据发布的风险。
技术领域
本发明属于数据处理技术领域,具体涉及一种基于知识图谱的隐私保护数据发布风险评估方法。
背景技术
随着大数据技术的广泛应用,数据已经成为许多公司的重要资产之一。目前的隐私保护数据发布系统仅对脱敏后数据的隐私泄露风险进行评估,而忽略了主动对数据申请者进行风险评估,恶意攻击者虽然无法从技术方面窃取隐私数据,但是可以利用社会工程学进行数据欺诈窃取,例如通过用户仿冒、组团欺诈等手段获取不同的数据,然后再用数据分析手段解析得到隐私数据。知识图谱作为一种基于图结构的技术,可以快速分析出其中的节点之间的关系。所以,将数据申请者映射到知识图谱中,基于知识图谱分析它们的隐含关系,可以有效的防范利用社会工程学窃取隐私数据。
发明内容
本发明目的在于提供一种基于知识图谱的隐私保护数据发布风险评估方法,可以有效防范隐私数据被窃取欺诈。本发明的目的是通过以下技术方案来实现的:
一种基于知识图谱的隐私保护数据发布风险评估方法,包括以下步骤:
S1,获取数据申请者的信息并将获取的信息映射为RDF数据集,然后转化为知识图谱中的图数据,然后转化为知识图谱中的图数据;
S2,基于知识图谱对数据申请者的基本信息进行检测,完成基本信息风险评估;
S3,基于知识图谱利用异常检测算法对数据申请者进行身份异常检测,完成身份异常风险评估;
S4,基于知识图谱利用社区发现算法对数据申请者团体之间进行社团划分,计算组团欺诈风险,完成数据申请者组团欺诈风险评估;
S5,基于知识图谱利用改进的个性化PageRank算法对数据申请者进行个体信用计算分析,完成数据申请者个体信用风险评估;
S6,结合所有风险评估数据,构建风险模型,按照评估标准对数据申请者进行风险评分,完成数据申请者的综合风险评估;
S7,对综合风险评估的得分采取分层标签化的方法进行处理,汇总得出风险评估结论以及具体的风险项评估结果。
进一步的,所述步骤S1中包含以下子步骤:
S101,根据关系型数据库的逻辑表,生成映射文件;
S102,解析映射文件,获取其中包含的映射元素;
S103,分析映射元素,获取其中的子元素和逻辑表及其属性列的映射规则;
S104,从关系型数据库中获取逻辑表中的元组,按照映射规则将元组中对应属性列映射为RDF术语;
S105,将得到的RDF术语组合为RDF三元组,输出到RDF数据集。
进一步的,所述的步骤S3中的身份异常风险评估包含以下子步骤:
S301,给定一个检测的目标用户其中是该目标用户的第i个属性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010139728.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人工心脏瓣膜
- 下一篇:基于无人机飞行平台的空中喷涂系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理