[发明专利]一种基于圆周卷积的知识图谱补全方法在审
申请号: | 202011041999.6 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112131406A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 侯杰;李俊;李鹏华;朱智勤;赵芬;苏豪;刘家尉 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 圆周 卷积 知识 图谱 方法 | ||
本发明涉及一种基于圆周卷积的知识图谱补全方法,属于自然语言处理领域。该方法包括:S1:对于三元组(ei,rk,ej)随机初始化得到它们对应的向量S2:把三元组按照设定比例分为合理三元组和扰乱三元组;S3:把关系向量通过一个全连接层处理并重构得到卷积核Wg;S4:利用圆周填充方法,对实体向量进行填充得到向量S5:卷积核Wg对处理后的实体向量进行卷积运算得到特征图M;S6:对特征图M进行处理后点积实体向量得到分数pi;S7:计算损失函数。本发明简化了实体和关系之间的交互,大大提升了预测效果。
技术领域
本发明属于自然语言处理领域,涉及基于圆周卷积的知识图谱补全方法。
背景技术
随着信息技术与互联网技术的高速发展,网络上各行各业的信息越来越多,我们逐渐进入一个信息化,智能化的时代。海量新的数据和信息每天都以不同的形式产生,由于这些内容具有大规模、多元化、组织结构松散等特点,如何从海量数据中获取有效信息已成为众多领域面临的主要难题。为此,许多公司开始构建自己的知识图谱,知识图谱实际上是一个以三元组(ei,rk,ej)形式结构的大型事实结构数据库,其中ei和ej表示主实体和对象实体,rk表示它们之间的关系,当前大型的知识图谱主要有Yago、Freebase、Google KG等。知识图谱可以广泛的用在搜索引擎、对话生成、问答系统等方面,也有许多优势,例如在搜索引擎方面引入了知识图谱,能够更好地从语义关系上了解用户的搜索意图,这一改进优化了以往的搜索方式,提高了搜索质量。但是知识图谱也存在一些问题,目前面临的最大问题即是知识图谱的不完整性,例如在Freebase中超过66%的人物实体没有出生地。为了解决这一重大难题,许多知识图谱补全的方法被提出,知识图谱补全目的是让知识图谱中的实体和关系表示为稠密低维实值向量,使得知识图谱中的实体和关系在低维空间中具有语义联系,让知识图谱推理出其中所隐含的关系或实体。目前主要有两种方法,一种是基于翻译模型(translationalmodels)的方法,另一种是基于卷积神经网络模型(convolutionalneural network based models)的方法。但是基于翻译模型的方法在知识图谱补全中效果较差,而且无法解决一对多或者多对一的问题,基于卷积神经网络模型的方法在一维实体和一维关系提取信息时并不直观。
发明内容
有鉴于此,本发明的目的在于提供一种基于圆周卷积的知识图谱补全方法,通过关系生成每个三元组特定的卷积层卷积核,并将这些过滤器应用到主实体嵌入中,从而简化实体和关系之间的交互,同时大大提升预测效果。
为达到上述目的,本发明提供如下技术方案:
一种基于圆周卷积的知识图谱补全方法,具体包括以下步骤:
S1:对于三元组(ei,rk,ej)随机初始化得到它们对应的向量
S2:把三元组按照设定比例分为合理三元组和扰乱三元组;
S3:把关系向量通过一个全连接层处理并重构得到卷积核Wg;
S4:利用圆周填充方法,对实体向量进行填充得到向量
S5:卷积核Wg对处理后的实体向量进行卷积运算得到特征图M;
S6:对特征图M进行处理后点积实体向量得到一个分数pi;
S7:把得到的分数pi进行损失函数计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011041999.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于互联网的各种名单多维度展示方法
- 下一篇:测试环境的切换方法及装置