[发明专利]一种面向知识图谱表示学习训练的局部训练方法在审
申请号: | 202010809387.0 | 申请日: | 2020-08-12 |
公开(公告)号: | CN111897975A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 涂志莹;万博;刘明义;王忠杰;徐晓飞 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 高媛 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 知识 图谱 表示 学习 训练 局部 方法 | ||
本发明公开了一种面向知识图谱表示学习训练的局部训练方法,所述方法包括如下步骤:步骤S1、获取知识图谱训练数据;步骤S2、计算训练所应使用的向量空间维度;步骤S3、判断是否可以通过调整原有模型得到新模型;步骤S4、模型训练;步骤S5、模型与数据存储。本发明可根据知识图谱的数据规模计算得出训练所需使用的向量空间维度,避免过小的维度造成模型性能不佳与过大的维度浪费计算资源与训练所需时间的问题。本发明对于变化的知识图谱,可以在原有表示学习模型的基础上进行训练调整,从而快速得到变化后知识图谱的表示学习模型,节省大量训练所需的时间,从而使上层应用可以更及时地感知到知识图谱的变化。
技术领域
本发明属于计算机知识图谱技术领域,涉及一种面向知识图谱表示学习训练的局部训练方法,具体涉及一种考虑到知识图谱持续变化的动态表示学习训练方法。
背景技术
知识图谱是一种由实体作为点,实体与实体之间的关系作为边而组成的图。自从2012年Google推出自己第一版知识图谱以来,知识图谱快速发展。知识图谱可以向外提供查询能力和推理能力,在社交网络、金融、医疗、反欺诈、企业关系分系等众多领域都得到了应用。而由于图搜索算法的高复杂性,当图谱中的数据量不断增大到一定程度后,图谱中的计算效率就会降低,同时数据稀疏问题也为图算法带来了困难。
表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,知识表示学习则面向知识库中的实体和关系进行表示学习。知识表示学习的出现很好地避免了图搜索算法的高复杂度问题,可以在低维空间中高效计算实体和关系的语义联系,有效解决数据稀疏问题,使知识获取、融合和推理的性能得到显著提升。
然而,知识图谱并不是一成不变的。随着新的知识不断加入到知识图谱,以及对于原有的不正确的知识的修改,知识图谱才能逐步的丰富、完整。传统的表示学习方法只关注表示学习模型的准确性,而忽略了对于训练时间代价的优化,同时也没有考虑到如何应对知识图谱动态变化的特点。传统的知识表示学习方法面对动态变化的知识图谱时,只能在知识图谱每一次发生变化后都从零开始重新进行训练,这会产生巨大的时间代价。在重新训练完成前,依靠该知识图谱提供知识支持的上层应用都无法感知到新获得的知识以及旧知识的变化。
知识图谱的变化是存在连续性的,在知识图谱的每一次变化中,大部分的原有知识都会得到保留,而知识图谱中发生的变化只占图谱中的一小部分。对于原有的知识,表示学习模型已经在对变化前图谱数据的训练中学习得到了,而传统的方法在对变化后图谱的训练过程中无法利用这些已经学习得到的知识,而是从零开始重新学习。这使得系统每一次都需要重复地学习相同的知识,这造成了计算资源的浪费,并且会产生难以接受的时间代价。
基于上述研究背景可以发现,通过对图谱变化前训练得到的知识表示学习模型充分利用,并在其基础上根据知识图谱的变化做出适当的调整,就可以快速得到变化后知识图谱的表示学习模型。
发明内容
为了解决现有技术中存在的以上问题,本发明对于面向知识图谱表示学习训练的局部训练问题,提出了一种面向知识图谱表示学习训练的局部训练方法。本发明可根据知识图谱的数据规模计算得出训练所需使用的向量空间维度,避免过小的维度造成模型性能不佳与过大的维度浪费计算资源与训练所需时间的问题。本发明对于变化的知识图谱,可以在原有表示学习模型的基础上进行训练调整,从而快速得到变化后知识图谱的表示学习模型,节省大量训练所需的时间,从而使上层应用可以更及时地感知到知识图谱的变化。
本发明的目的是通过以下技术方案实现的:
一种面向知识图谱表示学习训练的局部训练方法,包括如下步骤:
步骤S1、获取知识图谱训练数据:
读取系统中存储的知识图谱数据,并以训练所需的特定数据格式存储,具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010809387.0/2.html,转载请声明来源钻瓜专利网。