[发明专利]知识图谱的数据处理方法及装置在审
申请号: | 202110572915.X | 申请日: | 2021-05-25 |
公开(公告)号: | CN113111193A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 卜晨阳;李淑婷;张家伟;李磊;吴信东 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 数据处理 方法 装置 | ||
本发明公开了一种知识图谱的数据处理方法及装置。其中,该方法包括:接收在知识图谱中待查询的目标节点,其中,知识图谱包括多个用于表示实体的节点以及不同节点之间用于表示实体关系的边;将目标节点与目标节点关联度最高的预设数量的关联节点合并为超节点,其中,超节点包括目标节点和关联节点之间的边;将超节点与知识图谱中的其他节点进行划分,得到包括超节点的目标子图,其中,目标子图用于查询目标节点。本发明解决了相关技术中知识图谱在发生变化后需要重新训练,耗费大量的计算量,对计算机造成较重的负担,导致运算效率低的技术问题。
技术领域
本发明涉及知识图谱领域,具体而言,涉及一种知识图谱的数据处理方法及装置。
背景技术
链接预测(Link Prediction)旨在根据知识图谱中已有的知识补全缺少的信息,或者预测未来可能会出现的连接,是一种广泛研究、旨在解决知识图谱不完整的任务。例如,在公安领域,为了打击犯罪情况的发生,可基于链接预测分析大型犯罪团伙的所有成员,从而进行集中抓捕,避免因为打草惊蛇而引起犯罪团伙的警惕。比如,在抓捕贩卖儿童这类大型犯罪团伙时,抓捕一个犯罪嫌疑人可能只会引起该团伙收敛一段时间,但是一段时间后会继续做案,并且抓捕一个犯罪嫌疑人后可能会引起整个犯罪团伙的警惕,丢失掉抓捕整个犯罪团伙的大好时机。
如果要抓捕一个犯罪嫌疑人及其犯罪团伙,数据系统内没有标记两个人是存在密切合作/确切的关系,可以通过对该犯罪嫌疑人的行为进行分析,例如存在三元组(犯罪嫌疑人a,入住,酒店B),(同伙,入住,酒店B)以及(犯罪嫌疑人a,乘坐,高铁c),(同伙,乘坐,高铁c),即使犯罪嫌疑人和同伙在明面上没有任何关系,通过链接预测方法则可以快速高效的判断出这两个人有很大可能是存在关系的。
知识图谱嵌入(Knowledge Graph Embedding)是目前链接预测领域的主流方法,旨在将知识图谱中实体和关系映射到连续向量空间中,基于向量距离的计算衡量实体之间可能存在的联系。例如,(h,r,?),(?,r,t),(h,?,t)三种知识图谱的补全任务。在上述例子中,将每个犯人的看作图中的一个节点,映射在向量空间中称为实体。每个犯人之间的边是犯人的关系,映射到向量空间中成为关系实体。任意选取一个头实体h和一个关系实体r,则可以通过向量之间的距离预测尾实体t。同理选取尾实体t和关系实体r预测头实体h,或者选取头实体h和尾实体t预测两者关系r。这一点在其他方面也有很多运用,比如,在社交网络中,进行用户/商品推荐,在生物学领域,进行相互作用发现,在知识图谱中,进行实体关系学习,在基础研究中,进行图结构捕捉等。
现有的知识图谱嵌入方法都是基于整个图进行训练。然而,很多实际问题的知识图谱是在频繁变化的,现有方法在知识图谱发生变化后需要重新训练这个图,需要耗费大量的计算量。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种知识图谱的数据处理方法及装置,以至少解决相关技术中知识图谱在发生变化后需要重新训练,耗费大量的计算量,对计算机造成较重的负担,导致运算效率低的技术问题。
根据本发明实施例的一个方面,提供了一种知识图谱的数据处理方法,包括:接收在知识图谱中待查询的目标节点,其中,所述知识图谱包括多个用于表示实体的节点以及不同节点之间用于表示实体关系的边;将所述目标节点与所述目标节点关联度最高的预设数量的关联节点合并为超节点,其中,所述超节点包括所述目标节点和所述关联节点之间的边;将所述超节点与所述知识图谱中的其他节点进行划分,得到包括所述超节点的目标子图,其中,所述目标子图用于查询所述目标节点。
可选的,将所述目标节点与所述目标节点关联度最高的预设数量的关联节点合并为超节点包括:确定所述知识图谱中与所述目标节点通过边相连的多个待定节点;确定每个待定节点与所述目标节点之间的第一欧氏距离;选取预设数量的第一欧氏距离最小的待定节点,作为所述关联节点;将所述目标节点和所述预设数量的关联节点,以及所述目标节点与所述关联节点之间的边合并为所述超节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110572915.X/2.html,转载请声明来源钻瓜专利网。