[发明专利]使用基于语义的数据链接增强隐私数据集的方法和系统在审

专利信息
申请号: 202111384582.4 申请日: 2021-11-19
公开(公告)号: CN114548202A 公开(公告)日: 2022-05-27
发明(设计)人: S·布拉金;K·勒瓦谢;C·皮恩托;M·西米奥尼 申请(专利权)人: 国际商业机器公司
主分类号: G06K9/62 分类号: G06K9/62;G06F16/36;G06F40/30;G06N5/02
代理公司: 北京市中咨律师事务所 11247 代理人: 刘薇;于静
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 基于 语义 数据 链接 增强 隐私 方法 系统
【说明书】:

公开了用于跨越多个数据集链接关于个体实体的信息的技术。接收具有与实体的至少一个属性相对应的一些信息的目标数据集。对目标数据集执行语义处理以提取信息的语义表示和对应的属性,其用于在至少一个其他数据集中搜索在目标数据集中不存在的与实体的至少一个属性相对应的附加信息,其用于用与实体相对应的附加信息来增强目标数据集。迭代地重复该过程,其中每个后续的迭代包括在先前的迭代的搜索中找到的信息的语义表示,直到在用现在被增强的目标数据集的语义表示来搜索多个数据集时没有找到关于实体的附加信息为止。在一些实施例中,所增强的目标数据集被用于确定实体的隐私风险。

技术领域

发明一般涉及数据隐私管理领域,尤其涉及用于数据隐私管理的数据聚合技术。

背景技术

信息或数据隐私是数据的收集和传播之间的关系、技术、隐私的公共期望以及围绕它们的法律和政治问题。数据隐私的重大挑战在于,它在试图保护个人的隐私偏好和个人可识别信息时依赖于数据。计算机安全、数据安全和信息安全领域都设计和使用软件、硬件和人力资源来解决数据隐私。

自然语言处理(有时被缩写为NLP)被认为是语言学、计算机科学和与计算机和人类语言之间的交互有关的人工智能的一个领域。尤其是如何对计算机编程以处理和分析大量的自然语言数据。

语义相似性是被应用于术语或文档集的度量,其中各项之间的距离是基于它们的语义内容或含义的相似性而不是词典上的相似性。这些是用于通过数字描述来近似语言单元、概念或实例之间的语义关系的强度的数学工具,而数字描述是通过比较支持它们的含义或描述它们的性质的信息而获得的。在高度一般性下,语义相似性、语义距离和语义相关性通常意味着“术语X与术语Y的关系如何?”这个问题的回答通常被表示为范围在 -1与1之间或在0与1之间的数值,其中1表示显著的相似度。

发明内容

根据本发明的一个方面,一种方法、计算机程序产品和/或系统执行以下操作(不一定按照以下顺序):(i)接收目标数据集,该目标数据集包括与多个实体相对应的多个子集,其中给定子集包括指示给定对应实体的至少一个属性的信息;(ii)对于给定子集,确定与给定实体的至少一个属性相对应的语义表示;以及(iii)使用目标数据集的所确定的语义表示作为初始参数来迭代地增强目标数据集,直到确定在所识别的辅助数据集中不存在给定实体的与从目标数据集中省略的属性相对应的语义表示,其包括:至少部分地基于目标数据集的所确定的语义表示,识别包括指示与给定实体相对应的属性的信息的辅助数据集,(b)确定在辅助数据集中存在的给定实体的属性的语义表示,(c)确定在所识别的辅助数据集中存在的给定实体的至少一个语义表示对应于从目标数据集中省略的属性,以及(d) 用所确定的与从目标数据集中省略的属性相对应的语义表示来增强目标数据集。

附图说明

图1是根据本发明的系统的第一实施例的框图;

图2是示出至少部分地由第一实施例系统执行的第一实施例方法的流程图;

图3是示出第一实施例系统的机器逻辑(例如,软件)部分的框图;

图4是由第一实施例系统生成的屏幕截图;以及

图5是根据本发明的第二实施例系统的框图。

具体实施方式

本发明的一些实施例针对用于跨越多个数据集链接关于个体实体的信息的技术。接收具有与实体的至少一个属性相对应的一些信息的目标数据集。对目标数据集执行语义处理以提取信息的语义表示和对应的属性,其用于在至少一个其他数据集中搜索在目标数据集中不存在的与实体的至少一个属性对应的附加信息,其用于用与实体对应的附加信息来增强目标数据集。这被迭代地重复,其中每个后续的迭代包括在先前迭代的搜索中找到的信息的语义表示,直到在用现在所增强的目标数据集的语义表示搜索多个数据集时没有找到关于实体的附加信息。在一些实施例中,所增强的目标数据集被用于确定实体的隐私风险。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111384582.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top