[发明专利]数据处理方法、装置、电子设备及存储介质在审
申请号: | 202010213661.8 | 申请日: | 2020-03-24 |
公开(公告)号: | CN111488461A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 王策 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种数据处理方法、装置、电子设备及存储介质,所述方法包括:获取用于描述第一已对齐实体的存量知识;获取用于描述当前待对齐实体的全量知识;获取所述全量知识与所述存量知识相比所增加的增量知识;基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体;在所述第二已对齐实体的基础上,基于所述增量知识对所述当前待对齐实体进行对齐。本公开实施例能够提高实体对齐的效率。
技术领域
本公开涉及知识图谱领域,具体涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
在知识图谱领域的现有技术中,每次实体对齐都需要重新对用于描述待对齐实体的知识进行预处理、融合,从而实现对待对齐实体的对齐。由于用于描述待对齐实体的知识的数量通常在千万级以上,现有技术的这种方法每次进行实体对齐都要耗费巨大的算力资源,实体对齐的效率低下。
发明内容
本公开的一个目的在于提出一种数据处理方法、装置、电子设备及存储介质,能够提高实体对齐的效率。
根据本公开实施例的一方面,公开了一种数据处理方法,所述方法包括:
获取用于描述第一已对齐实体的存量知识;
获取用于描述当前待对齐实体的全量知识;
获取所述全量知识与所述存量知识相比所增加的增量知识;
基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体;
在所述第二已对齐实体的基础上,基于所述增量知识对所述当前待对齐实体进行对齐。
根据本公开实施例的一方面,公开了一种数据处理装置,所述装置包括:
第一获取模块,配置为获取用于描述第一已对齐实体的存量知识;
第二获取模块,配置为获取用于描述当前待对齐实体的全量知识;
第三获取模块,配置为获取所述全量知识与所述存量知识相比所增加的增量知识;
精简模块,配置为基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体;
对齐模块,配置为在所述第二已对齐实体的基础上,基于所述增量知识对所述当前待对齐实体进行对齐。
在本公开的一示例性实施例中,所述装置配置为:
确定所述全量知识与所述存量知识相比所减少的减量知识;
将所述减量知识从所述存量知识中删除;
基于预设的知识融合策略对删除后剩余的存量知识进行融合,以对所述第一已对齐实体进行精简得到所述第二已对齐实体。
在本公开的一示例性实施例中,所述增量知识包括至少一组知识,所述存量知识包括至少一组知识。所述装置配置为:
若所述增量知识中的一组知识的标识与所述存量知识中的目标组知识的标识相同,则将所述目标组知识从所述存量知识中删除;
基于预设的知识融合策略对删除后剩余的存量知识进行融合,以对所述第一已对齐实体进行精简得到所述第二已对齐实体。
在本公开的一示例性实施例中,所述增量知识包括至少一组知识,所述存量知识包括至少一组知识。所述装置配置为:
基于预设的知识融合策略对所述增量知识进行融合,得到所述增量知识所描述的已对齐实体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010213661.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:直接联接的兼容式喷洒器
- 下一篇:一种车辆数据的记录方法及系统