[发明专利]一种基于特征提取的知识图谱关系预测方法在审
申请号: | 202210044332.4 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114385831A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 吴涛;马红玉;冯柏淋;姜丰;游小琳 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06V10/75;G06V10/774;G06V10/82;G06K9/62;G06N5/02 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 提取 知识 图谱 关系 预测 方法 | ||
本发明属于知识图谱补全领域,具体涉及一种基于特征提取的知识图谱关系预测方法;该方法包括:获取原始数据;根据原始数据构建初始知识图谱和待预测三元组;采用训练好的邻居编码器对待预测三元组进行处理,得到关系正确的三元组;根据关系正确的三元组补全初始知识图谱,得到完整的知识图谱;本发明结合特征提取与相似度计算机制,解决了传统知识图谱关系预测方法需要大量数据支撑的问题,采用少样本数据可较准确的对知识图谱进行关系预测,可获得更加准确的知识图谱,同时提升了少样本关系预测方法的性能和计算效率,具有广阔的应用前景。
技术领域
本发明属于知识图谱补全领域,具体涉及一种基于特征提取的知识图谱关系预测方法。
背景技术
知识图谱是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到data级别,聚合大量知识,从而实现知识的快速响应和推理。现有的人们熟知的知识图谱有Google搜索、百度搜索、天眼查企业图谱等。
由于计算机技术的不断发展,知识图谱作为人工智能的支柱,因其强大的知识表示和推理能力而受到了学术界和工业界的广泛关注。近年来,知识图谱已经广泛应用于语义搜索、智能问答、知识管理等领域中。但是知识图谱在广泛应用的同时,其本身也存在一些问题。目前应用的知识图谱通常都是不完整的,并且是不断增长的,每当有新的知识产生,知识图谱中就会新增节点或者边,但在增长的过程中可能会出现信息采集的错误或者人为的误操作,导致知识图谱中缺失了应有的关系或者实体。因此,为了解决不完整的问题,使图谱知识趋于丰富和完整,知识图谱的补全技术应运而生。当前基于表示学习的推理是主流的补全技术手段,但是大多数表示学习的研究都是在假设有充足的三元组实例的情况下进行的。然而在实际情况下,大部分知识图谱都存在长尾知识(long-tailknowledge),即只有很少的关系或实体存在大量相关三元组,其余的关系或实体仅有非常少的三元组与之相关(少样本问题)。这种长尾知识在现实的知识图谱中是普遍存在的现象,而以往的研究往往忽略了它们;因此,亟需一种方法来解决知识图谱中的长尾现象问题。
发明内容
针对现有技术存在的不足,本发明提出了一种基于特征提取的知识图谱关系预测方法,该方法包括:获取原始数据;根据原始数据构建初始知识图谱和待预测三元组;采用训练好的邻居编码器对待预测三元组进行处理,得到关系正确的三元组;根据关系正确的三元组补全初始知识图谱,得到完整的知识图谱;
对邻居编码器进行训练的过程包括:
S1:获取正确的知识图谱;对知识图谱进行预处理,得到知识图谱的嵌入表示;
S2:在知识图谱中随机抽取K个三元组并将K个三元组作为支持集,将剩下的三元组作为正样本查询集;其中,三元组是包含头实体、关系实体和尾实体的管理单元;
S3:对正样本查询集中三元组的尾实体进行替换,得到负样本查询集;
S4:对知识图谱中所有实体的邻居实体进行抽样,得到每个实体的所有邻居实体;
S5:采用邻居编码器对每个实体的邻居实体进行特征提取,得到每个实体的邻居特征;
S6:将每个实体的邻居特征和对应实体进行融合,得到更新后的实体;
S7:将支持集与查询集中三元组的头实体和尾实体进行拼接,得到支持实体对和查询实体对;其中,查询集包括正样本查询集和负样本查询集;
S8:根据支持实体对和查询实体对计算支持实体对与查询实体对的相似度;
S9:根据支持实体对与正样本查询实体对的相似度和支持实体对与负样本查询实体对的相似度计算损失函数,根据损失函数调整邻居编码器参数,当损失函数最小时,得到训练好的邻居编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210044332.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有保温结构的注塑机
- 下一篇:计算机信息技术高效散热储存系统