[发明专利]文本实体关系抽取方法、装置及计算机可读存储介质设备有效

专利信息
申请号: 202010693018.X 申请日: 2020-07-17
公开(公告)号: CN111881256B 公开(公告)日: 2022-11-08
发明(设计)人: 胡浩;张玉臣;周洪伟;何淼;朱红涛 申请(专利权)人: 中国人民解放军战略支援部队信息工程大学;河南金明源信息技术有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/211;G06F40/279;G06F40/30;G06N3/08
代理公司: 郑州大通专利商标代理有限公司 41111 代理人: 周艳巧
地址: 450000 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 实体 关系 抽取 方法 装置 计算机 可读 存储 介质 设备
【权利要求书】:

1.一种文本实体关系抽取方法,其特征在于,包含如下内容:

针对输入文本,通过将单词获取词向量表示,以获取其中实体对语句特征;

利用点互信息PMI计算实体对关系之间相似度,并通过相似度得到类关系;

通过类关系查找实体关系之间隐含内容;

获取词向量表示中,将单词转化为低维向量,假设给定多个单词组成的句子,句子中所有单词使用位置嵌入,每个单词用实值向量表示,单词嵌入通过嵌入矩阵进行编码,将句子中所有单词嵌入和位置嵌入进行连接,获取完整的词向量表示,通过词向量表示以提取实体对与上下文语义相关程度;

实体对关系之间相似度计算中,假设实体对包含多个关系集合,关系集合对应有低维向量集合,使用两个关系的向量内积计算获取两者之间的相似性权重;通过比对关系集合中其他关系与目标关系的相似程度,找到与目标关系相似性权重最高的关系,然后使用点互信息PMI计算目标关系和该相似性权重最高的关系之间的语义相似度;依据语义相似度计算结果,判定与目标关系具有类关系的其他关系。

2.根据权利要求1所述的文本实体关系抽取方法,其特征在于,针对输入文本,构建用于关系抽取的神经网络模型,通过模型训练学习,以提取实体关系之间隐含内容;该模型中包含:用于将目标输入文本中单词转化为低维向量的输入层;用于获取输入文本语句特征的双向门控循环单元;用于获取句子向量表示的最大池化层,及用于单词和句子权重分配的注意机制。

3.根据权利要求2所述的文本实体关系抽取方法,其特征在于,双向门控循环单元包含隐藏状态、重置门结构和更新门结构;将词向量表示输入双向门控循环单元,通过计算重置门结构和更新门结构产生的正反向状态特征值来获取句子高维语义信息。

4.根据权利要求1或2所述的文本实体关系抽取方法,其特征在于,语句特征获取包含基于单词级特征获取,假设句子包含多个单词,对对应单词设定加权值,将关系与实体对放入同一嵌入空间,将单词和关系的向量表示连接到两者之间的相关程度。

5.根据权利要求4所述的文本实体关系抽取方法,其特征在于,语句特征获取还包含基于句子级特征获取,假设集合中包含多个具有实体对的句子,通过句子和预测关系匹配程度进行评分来获取句子对预测关系的权重,以弱化噪音数据。

6.根据权利要求1所述的文本实体关系抽取方法,其特征在于,通过抽取类关系,找出符合与目标关系具有类关系的其他关系,以挖掘关系之间隐含关系。

7.一种文本实体关系抽取装置,其特征在于,包含:特征表示模块、相似计算模块及关系挖掘模块,其中,

特征表示模块,用于针对输入文本,通过将单词获取词向量表示,以获取其中实体对语句特征;

相似计算模块,用于利用点互信息PMI计算实体对关系之间相似度,并通过相似度得到类关系;

关系挖掘模块,用于通过类关系查找实体关系之间隐含内容;

获取词向量表示中,将单词转化为低维向量,假设给定多个单词组成的句子,句子中所有单词使用位置嵌入,每个单词用实值向量表示,单词嵌入通过嵌入矩阵进行编码,将句子中所有单词嵌入和位置嵌入进行连接,获取完整的词向量表示,通过词向量表示以提取实体对与上下文语义相关程度;

实体对关系之间相似度计算中,假设实体对包含多个关系集合,关系集合对应有低维向量集合,使用两个关系的向量内积计算获取两者之间的相似性权重;通过比对关系集合中其他关系与目标关系的相似程度,找到与目标关系相似性权重最高的关系,然后使用点互信息PMI计算目标关系和该相似性权重最高的关系之间的语义相似度;依据语义相似度计算结果,判定与目标关系具有类关系的其他关系。

8.一种计算机可读存储介质设备,其上存储有被处理器运行的计算机程序,所述计算机程序用于执行权利要求1~6任一项所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学;河南金明源信息技术有限公司,未经中国人民解放军战略支援部队信息工程大学;河南金明源信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010693018.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top