[发明专利]一种基于图神经网络的关系抽取方法在审
申请号: | 202110563551.9 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113297838A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 莫益军;姚盛楠 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 张晓冬 |
地址: | 436044 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 关系 抽取 方法 | ||
1.一种基于图神经网络的关系抽取方法,其特征在于,所述方法包括步骤:
对待抽取文档进行数据处理;
构建所述文档中句子的模型数据集;
获取所述句子的语义特征向量;
根据所述数据处理结果和所述语义特征向量生成所述句子的实体间邻域信息表达;
根据所述实体间邻域信息表达强化所述句子的句子表达;
根据所述数据处理结果和所述句子表达获取所述句子的句子池化表达和主客体池化表达;
将所述句子池化表达和所述主客体池化表达进行级联表示;
根据所述级联表示获取所述句子的关系类别表示。
2.根据权利要求1所述的基于图神经网络的关系抽取方法,其特征在于,所述对待抽取文档进行数据处理包括步骤:
获取所述待抽取文档;
对所述待抽取文档中的句子进行数据清洗操作;
对所述句子进行分词操作;
提取所述句子的依存句法关系信息;
获取所述句子的主客体位置信息。
3.根据权利要求2所述的基于图神经网络的关系抽取方法,其特征在于,所述对所述待抽取文档中的句子进行数据清洗操作包括步骤:
将所有所述句子统一为同一预设格式;
删除所有所述句子中的无用段落;
删除所有所述句子中的异样字符;
删除所有所述句子中的重复内容;
删除所有所述句子中的无用内容。
4.根据权利要求1所述的基于图神经网络的关系抽取方法,其特征在于,所述构建所述文档中句子的模型数据集包括步骤:
获取条件随机场模型和图的依存句法分析;
基于所述条件随机场模型构建所述句子的句子模型;
基于所述图的依存句法分析生成每个待分析句子对应的有向图;
根据所述有向图确定所述句子中实体的位置信息和关系类别信息;
整合所述句子的相关数据信息;
将所述相关数据信息存入字典中。
5.根据权利要求1所述的基于图神经网络的关系抽取方法,其特征在于,所述获取所述句子的语义特征向量包括步骤:
获取所述模型数据集;
获取所述模型数据集中所述句子的词向量;
将所述词向量输入RNN,
获取所述RNN输出的句子向量表达;
在所述句子向量表达中增加位置特征维度;
获取图卷积神经网络模型的输入特征向量。
6.根据权利要求1所述的基于图神经网络的关系抽取方法,其特征在于,所述根据所述数据处理结果和所述语义特征向量生成所述句子的实体间邻域信息表达包括步骤:
获取所述数据处理结果中的依存句法关系信息;
将所述依存句法关系信息转换为邻接矩阵;
获取图卷积神经网络模型的输入特征向量;
将所述邻接矩阵和所述输入特征向量输入所述图卷积神经网络模型中;
计算所述图卷积神经网络模型对应的一阶邻域依赖;
获取加权图卷积网络模型;
在所述加权图卷积网络模型中添加依赖树的虚拟边;
构造所述依赖树的逻辑邻接矩阵;
将所述逻辑邻接矩阵输入所述加权图卷积网络模型中;
计算所述加权图卷积网络模型对应的k阶邻域依赖。
7.根据权利要求1所述的基于图神经网络的关系抽取方法,其特征在于,所述根据所述实体间邻域信息表达强化所述句子的句子表达包括步骤:
获取关系注意力模块和位置注意力模块;
获取所述实体间邻域信息表达;
将所述实体间邻域信息表达作为所述位置注意力模块的原始特征表达;
计算所述句子的位置注意矩阵;
计算所述句子的关系注意矩阵;
将所述关系注意矩阵作为邻接矩阵输入图神经网络模型中;
获取所述图神经网络模型输出的图卷积特征表达结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110563551.9/1.html,转载请声明来源钻瓜专利网。