[发明专利]实体属性处理方法、装置、设备及介质有效
申请号: | 202010289148.7 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111488464B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 徐程程 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 属性 处理 方法 装置 设备 介质 | ||
公开了一种实体属性处理方法、装置、设备及介质,该方法包括:获取目标实体的实体信息簇,所述目标实体具有多个属性,所述实体信息簇对应于多个实体信息源,每个属性与至少一个实体信息源相对应,对于每个属性,在实体信息簇中包括提供该属性的至少一个实体信息源的标识、以及实体信息源所提供的属性值;对该目标实体的所述多个属性中的每个属性,确定该属性的属性类型,并根据该属性类型确定其所对应的属性值处理策略,其中所述属性类型包括单值属性、多值属性、保留属性、依赖型属性之一;根据所确定的属性值处理策略,基于与该属性对应的实体信息源所提供的属性值生成属性的融合属性值,对不同属性采用不同属性值处理策略,有效地筛选属性值。
技术领域
本发明涉及图谱构建领域,更具体地涉及一种实体属性处理方法、实体属性处理装置、实体属性处理设备及介质。
背景技术
随着人工智能在民用和商用领域的广泛应用,图谱构建在业务大数据化、智能化等过程中起到日益重要的作用,因此对于图谱构建,特别是知识图谱构建也面临着更高的要求。
目前在知识图谱的构建中,通常包括知识抽取,实体对齐,属性处理,知识存储的步骤。在多个网站中抽取实体的属性信息且进行实体对齐之后,要经过属性处理,筛选出有效的属性值进行保存,才能避免最终的结果冗余。现有的属性处理方法大多没有构建完善的属性处理架构,仅采用将所得到的属性值全部保留的方式。这种策略对于某些属性(例如“代表作”属性)是有效的,但是对于其他属性(例如“出生地”属性等),当采用全保留方式进行处理时,一方面会带来大量的重复属性值,增加存储开销;另一方面也带来了存储错误属性值的隐患,导致所生成的知识图谱的准确度降低。
因此,需要一种在实现实体属性处理的前提下,能够构建完善的属性处理架构,对于不同的属性采用不同的属性值处理策略,有效地筛选属性值,减小属性值存储开销,并提高所生成的知识图谱的精确度的方法。
发明内容
针对以上问题,本公开提供了一种实体属性处理方法、实体属性处理装置、实体属性处理设备及介质。利用本公开提供的实体属性处理方法能够在实现良好的属性值处理的前提下,对于不同的属性采用不同的属性值处理策略,有效地筛选属性值,减小属性值存储开销,并提高所生成的知识图谱的精确度。
根据本公开的一方面,提出了一种实体属性处理方法,包括:获取目标实体的实体信息簇,所述目标实体具有多个属性,所述实体信息簇对应于多个实体信息源,每个属性与至少一个实体信息源相对应,对于每个属性,在实体信息簇中包括提供该属性的至少一个实体信息源的标识、以及该实体信息源所提供的属性值;对该目标实体的所述多个属性中的每个属性,确定该属性的属性类型,并根据该属性类型确定其所对应的属性值处理策略,其中所述属性类型包括单值属性、多值属性、保留属性、依赖型属性之一;以及根据所确定的属性值处理策略,基于与该属性对应的实体信息源所提供的属性值,生成该属性的融合属性值。
在一些实施例中,所述属性值处理策略包括:在该属性的属性类型为多值属性的情况下,基于该属性的实体信息源排序结果,将排序最先的实体信息源确定为目标实体信息源,并将该目标实体信息源所提供的属性值作为融合属性值;或在该属性的属性类型为单值属性的情况下,基于该属性的属性值排序结果,将排序最先的属性值确定融合属性值。
在一些实施例中,所述属性值处理策略包括:在该属性的属性类型指示该属性为依赖型属性的情况下:获取该属性的依赖属性;获取该依赖属性的融合属性值所对应的实体信息源;将该实体信息源中对应于该属性的属性值确定为该属性的融合属性值。
在一些实施例中,在该属性的属性类型为多值属性的情况下,且在该属性与至少两个实体信息源相对应的情况下,该方法还包括:对该属性的实体信息源进行排序以得到实体信息源排序结果,其中所述排序包括:对所述至少两个实体信息源中的每个实体信息源,获取该实体信息源的预设优先级;根据所述预设优先级,对所述至少两个实体信息源进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010289148.7/2.html,转载请声明来源钻瓜专利网。