[发明专利]文本中实体关系的抽取方法、装置、电子设备及存储介质有效
申请号: | 202110833660.8 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113282717B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 苏志鹄;刘娇;张奇 | 申请(专利权)人: | 北京惠每云科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/295;G06F40/30;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 实体 关系 抽取 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种文本中实体关系的抽取方法、装置、电子设备及存储介质,将待抽取文本输入至预先训练好的概念抽取模型中,得到概念序列;根据预设的元组生成规则,确定出与该概念序列对应的多个待判断元组;根据至少一个特征判断规则,生成各个待判断关系元组对应的关系特征向量后,合并成待抽取文本的关系特征矩阵;将关系特征矩阵输入至预先训练好的元组判断模型中,得到对各个待判断关系元组对应的元组判断结果值,进而确定出待抽取文本的目标实体关系。这样,减少了获取不同维度元组的步骤,同时基于关系特征矩阵的判断,为对各个待判断关系元组判断提供了更可靠的依据,有助于提高根据关系元组对文本中的实体关系抽取的效率以及准确率。
技术领域
本申请涉及数据处理技术领域,尤其是涉及文本中实体关系的抽取方法、装置、电子设备及存储介质。
背景技术
随着大数据技术的飞速发展,针对于数据处理的技术也被广泛地应用于各个领域中,在数据的处理过程中需要处理的数据大致可以分为两类,结构化数据以及非结构化数据,而为了更便捷地对数据进行分析处理,常需要将非结构化数据转化为结构化数据后,在对转化后的结构化数据进行处理,常用的非结构化数据转化为结构化数据的方式就是实体关系抽取。
现阶段,针对于文本的实体关系抽取,均是先对文本进行特定元组的抽取后,再进行实体关系的判别,但是从文本中抽取的元组维度均是特定的维度,而实体之间的关系往往是比较复杂的多维度关系,因此,在对实体关系的抽取判断过程,需要进行多步骤的处理,耗费了数据处理时间,影响了对实体关系抽取的效率。
发明内容
有鉴于此,本申请的目的在于提供文本中实体关系的抽取方法、装置、电子设备及存储介质,针对于处理后的概念序列,利用预设的元组生成规则生成不同维度的待判断关系元组,再直接根据多个待判断关系元组以及特征判断规则,确定出关系特征矩阵,基于关系特征矩阵,确定出待抽取文本对应的待判断关系元组,以此进行文本实体关系的抽取,减少了获取不同维度元组的步骤,同时基于关系特征矩阵的判断,为对各个待判断关系元组判断提供了更可靠的依据,有助于提高根据关系元组对文本中的实体关系抽取的效率以及准确率。
本申请实施例提供了一种文本中实体关系的抽取方法,所述抽取方法包括:
将待抽取文本输入至预先训练好的概念抽取模型中,得到与所述待抽取文本对应的概念序列;
基于预设的元组生成规则,确定出与所述概念序列对应的多个待判断关系元组;其中,所述多个待判断关系元组包括维度大于三维的高维度元组以及维度小于或者等于三维的元组;
基于至少一个预设的特征判断规则,生成与各个待判断关系元组对应的关系特征向量,并基于确定出的多个关系特征向量,生成与所述待抽取文本对应的关系特征矩阵;
将所述关系特征矩阵输入至预先训练好的元组判断模型中,得到每个待判断关系元组对应的元组判断结果值,基于所述元组判断结果值满足预设判断条件的待判断关系元组,确定所述待抽取文本的目标实体关系,以表征所述待抽取文本中包括的多个实体,以及各个实体之间的关联关系。
进一步的,所述基于至少一个预设的特征判断规则,生成与各个待判断关系元组对应的关系特征向量,包括:
根据待抽取文本所属的领域,获取预设的至少一个与领域对应的预设的特征判断规则;
针对于每一个待判断关系元组,分别基于预设的特征判断规则对该待判断关系元组进行判断,得到该待判断关系元组在每个特征判断规则下的属性特征;
针对于每一个待判断关系元组,根据该待判断关系元组在各个特征判断规则下的属性特征、预先获取的词语义向量、字语义向量、序列向量以及位置向量,生成该待判断关系元组对应的关系特征向量。
进一步的,当所述预设的特征判断规则包括遗漏判断规则时,通过以下步骤得到待判断关系元组的属性特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠每云科技有限公司,未经北京惠每云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110833660.8/2.html,转载请声明来源钻瓜专利网。