[发明专利]数据处理方法、装置、电子设备及存储介质在审
申请号: | 202010213661.8 | 申请日: | 2020-03-24 |
公开(公告)号: | CN111488461A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 王策 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取用于描述第一已对齐实体的存量知识;
获取用于描述当前待对齐实体的全量知识;
获取所述全量知识与所述存量知识相比所增加的增量知识;
基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体;
在所述第二已对齐实体的基础上,基于所述增量知识对所述当前待对齐实体进行对齐。
2.根据权利要求1所述的方法,其特征在于,基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体,包括:
确定所述全量知识与所述存量知识相比所减少的减量知识;
将所述减量知识从所述存量知识中删除;
基于预设的知识融合策略对删除后剩余的存量知识进行融合,以对所述第一已对齐实体进行精简得到所述第二已对齐实体。
3.根据权利要求1所述的方法,其特征在于,所述增量知识包括至少一组知识,所述存量知识包括至少一组知识;
基于所述全量知识与所述存量知识的匹配对所述第一已对齐实体进行精简,得到精简后的第二已对齐实体,包括:
若所述增量知识中的一组知识的标识与所述存量知识中的目标组知识的标识相同,则将所述目标组知识从所述存量知识中删除;
基于预设的知识融合策略对删除后剩余的存量知识进行融合,以对所述第一已对齐实体进行精简得到所述第二已对齐实体。
4.根据权利要求1所述的方法,其特征在于,所述增量知识包括至少一组知识,所述存量知识包括至少一组知识;
基于所述增量知识对所述当前待对齐实体进行对齐,包括:
基于预设的知识融合策略对所述增量知识进行融合,得到所述增量知识所描述的已对齐实体;
基于所述增量知识中各组知识分别与所述存量知识中各组知识的匹配,将所述增量知识所描述的已对齐实体与所述第二已对齐实体进行对齐,以对所述当前待对齐实体进行对齐。
5.根据权利要求4所述的方法,其特征在于,基于预设的知识融合策略对所述增量知识进行融合,得到所述增量知识所描述的已对齐实体,包括:
获取所述增量知识中各组知识分别对应的第一向量;
基于各所述第一向量之间的距离,确定所述增量知识中各组知识之间的相似度;
基于预设的聚类算法以及所述增量知识中各组知识之间的相似度,对所述增量知识进行聚类,得到所述增量知识所描述的已对齐实体。
6.根据权利要求4所述的方法,其特征在于,基于所述增量知识中各组知识分别与所述存量知识中各组知识的匹配,将所述增量知识所描述的已对齐实体与所述第二已对齐实体进行对齐,包括:
获取所述增量知识中各组知识分别对应的第一向量;
获取所述存量知识中各组知识分别对应的第二向量;
基于各所述第一向量分别与各所述第二向量的距离,确定所述增量知识中各组知识分别与所述存量知识中各组知识的相似度;
若所述增量知识中的第一组知识与所述存量知识中的第二组知识的相似度大于预设阈值,则将所述第一组知识所描述的已对齐实体与所述第二组知识所描述的第二已对齐实体进行对齐。
7.根据权利要求1所述的方法,其特征在于,所述存量知识包括至少一组知识;
所述第一已对齐实体通过以下方法得到:
基于所述存量知识中各组知识之间的匹配,对所述存量知识进行划分得到至少一个集合;
分别对所述至少一个集合中包含的知识进行融合,得到所述第一已对齐实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010213661.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:直接联接的兼容式喷洒器
- 下一篇:一种车辆数据的记录方法及系统