[发明专利]使用基于语义的数据链接增强隐私数据集的方法和系统在审
申请号: | 202111384582.4 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114548202A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | S·布拉金;K·勒瓦谢;C·皮恩托;M·西米奥尼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/36;G06F40/30;G06N5/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘薇;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 基于 语义 数据 链接 增强 隐私 方法 系统 | ||
公开了用于跨越多个数据集链接关于个体实体的信息的技术。接收具有与实体的至少一个属性相对应的一些信息的目标数据集。对目标数据集执行语义处理以提取信息的语义表示和对应的属性,其用于在至少一个其他数据集中搜索在目标数据集中不存在的与实体的至少一个属性相对应的附加信息,其用于用与实体相对应的附加信息来增强目标数据集。迭代地重复该过程,其中每个后续的迭代包括在先前的迭代的搜索中找到的信息的语义表示,直到在用现在被增强的目标数据集的语义表示来搜索多个数据集时没有找到关于实体的附加信息为止。在一些实施例中,所增强的目标数据集被用于确定实体的隐私风险。
技术领域
本发明一般涉及数据隐私管理领域,尤其涉及用于数据隐私管理的数据聚合技术。
背景技术
信息或数据隐私是数据的收集和传播之间的关系、技术、隐私的公共期望以及围绕它们的法律和政治问题。数据隐私的重大挑战在于,它在试图保护个人的隐私偏好和个人可识别信息时依赖于数据。计算机安全、数据安全和信息安全领域都设计和使用软件、硬件和人力资源来解决数据隐私。
自然语言处理(有时被缩写为NLP)被认为是语言学、计算机科学和与计算机和人类语言之间的交互有关的人工智能的一个领域。尤其是如何对计算机编程以处理和分析大量的自然语言数据。
语义相似性是被应用于术语或文档集的度量,其中各项之间的距离是基于它们的语义内容或含义的相似性而不是词典上的相似性。这些是用于通过数字描述来近似语言单元、概念或实例之间的语义关系的强度的数学工具,而数字描述是通过比较支持它们的含义或描述它们的性质的信息而获得的。在高度一般性下,语义相似性、语义距离和语义相关性通常意味着“术语X与术语Y的关系如何?”这个问题的回答通常被表示为范围在 -1与1之间或在0与1之间的数值,其中1表示显著的相似度。
发明内容
根据本发明的一个方面,一种方法、计算机程序产品和/或系统执行以下操作(不一定按照以下顺序):(i)接收目标数据集,该目标数据集包括与多个实体相对应的多个子集,其中给定子集包括指示给定对应实体的至少一个属性的信息;(ii)对于给定子集,确定与给定实体的至少一个属性相对应的语义表示;以及(iii)使用目标数据集的所确定的语义表示作为初始参数来迭代地增强目标数据集,直到确定在所识别的辅助数据集中不存在给定实体的与从目标数据集中省略的属性相对应的语义表示,其包括:至少部分地基于目标数据集的所确定的语义表示,识别包括指示与给定实体相对应的属性的信息的辅助数据集,(b)确定在辅助数据集中存在的给定实体的属性的语义表示,(c)确定在所识别的辅助数据集中存在的给定实体的至少一个语义表示对应于从目标数据集中省略的属性,以及(d) 用所确定的与从目标数据集中省略的属性相对应的语义表示来增强目标数据集。
附图说明
图1是根据本发明的系统的第一实施例的框图;
图2是示出至少部分地由第一实施例系统执行的第一实施例方法的流程图;
图3是示出第一实施例系统的机器逻辑(例如,软件)部分的框图;
图4是由第一实施例系统生成的屏幕截图;以及
图5是根据本发明的第二实施例系统的框图。
具体实施方式
本发明的一些实施例针对用于跨越多个数据集链接关于个体实体的信息的技术。接收具有与实体的至少一个属性相对应的一些信息的目标数据集。对目标数据集执行语义处理以提取信息的语义表示和对应的属性,其用于在至少一个其他数据集中搜索在目标数据集中不存在的与实体的至少一个属性对应的附加信息,其用于用与实体对应的附加信息来增强目标数据集。这被迭代地重复,其中每个后续的迭代包括在先前迭代的搜索中找到的信息的语义表示,直到在用现在所增强的目标数据集的语义表示搜索多个数据集时没有找到关于实体的附加信息。在一些实施例中,所增强的目标数据集被用于确定实体的隐私风险。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111384582.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自主驾驶应用的应急响应车辆检测
- 下一篇:一种立体智能仓储系统及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置