[发明专利]一种实体关系识别方法、装置及可读介质有效

专利信息
申请号: 202110602654.1 申请日: 2021-05-31
公开(公告)号: CN113268575B 公开(公告)日: 2022-08-23
发明(设计)人: 蒋佳佳;肖龙源;李稀敏;邹辉 申请(专利权)人: 厦门快商通科技股份有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06F40/295;G06N3/04;G06N3/08
代理公司: 厦门市首创君合专利事务所有限公司 35204 代理人: 连耀忠
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 关系 识别 方法 装置 可读 介质
【说明书】:

发明公开了一种实体关系识别方法、装置及可读介质,利用实体在三元组中的位置以及对应的实体类型对语句中的实体进行信息增强;将完成信息增强的语句通过训练好的word2vec模型进行字嵌入,得到字嵌入特征;将字嵌入特征输入特征提取模型,特征提取模型包括依次连接的Dropout层、单层BiLSTM层和LayerNorm层,得到语句中每个字符对应的特征;将相应实体特定位置字符对应的特征进行向量拼接,并将拼接后的特征输入线性分类层进行分类,得到实体关系。通过自训练的word2vec可以部署在实际生成环境中,进行快速的实体关系识别。对于语句中的实体信息进行了实体位置和实体类型信息嵌入,增加了模型的识别效果。模型结构简单,参数量少,计算效率高,能够及时响应线上对话系统需求。

技术领域

本发明涉及自然语言处理领域,具体涉及一种实体关系识别方法、装置及可读介质。

背景技术

从非结构化文本中识别实体关系在对话领域中已经成为了非常重要的研究课题。主要应用于对话领域中,挖掘对话系统中存在的实体关系和要询问的实体关系,并通过已经建立的存储了大规模实体关系对的知识图谱进行查询,可以得到准确的答案,以便对话系统可以自动做出针对性的回答。现在关系识别最常见的做法是通过复杂的神经网络模型与大规模预训练模型相结合进行关系识别以达到最佳的识别结果。现在一般采用三元组形式表示实体关系,如“实体1,关系,实体2”。

但现有的实体关系识别算法有着以下几个方面的局限性:

(1)在嵌入过程中,应用大规模预训练模型,虽然可以很好的获取对应的特征,然而预训练模型规模都较大,导致最终模型较大,难以在实际生产环境中部署。

(2)为了获取更好的识别效果,除了应用大规模预训练模型外,还设计了复杂的网络模型,都进一步增加了模型参数,导致最终模型计算效率低下,无法及时响应线上对话需求识别出实体关系。

(3)现有的关系识别算法中,识别的都是实体对之间的关系,无法挖掘对话系统中,对于单实体的关系问询。

发明内容

针对上述提到的大规模预训练模型较大,以及复杂的网络模型效率低、无法挖掘单实体的关系问询等问题。本申请的实施例的目的在于提出了一种实体关系识别方法、装置及可读介质,来解决以上背景技术部分提到的技术问题。

第一方面,本申请的实施例提供了一种实体关系识别方法,包括以下步骤:

S1,利用实体在三元组中的位置以及对应的实体类型对语句中的实体进行信息增强;

S2,将完成信息增强的语句通过训练好的word2vec模型进行字嵌入,得到字嵌入特征;

S3,将字嵌入特征输入特征提取模型,特征提取模型包括依次连接的Dropout层、单层BiLSTM层和LayerNorm层,得到语句中每个字符对应的特征;以及

S4,将相应的实体特定位置字符对应的特征进行向量拼接,并将拼接后的特征输入线性分类层进行分类,得到实体关系。

在一些实施例中,步骤S4中的将相应的实体特定位置字符对应的特征进行向量拼接具体包括:对于存在多个实体的语句,将多个实体的首字位置对应的特征进行向量拼接。

在一些实施例中,步骤S4中的将相应的实体特定位置字符对应的特征进行向量拼接具体包括:对于只包含一个实体的语句,将实体的首字位置对应的特征和所述语句的尾字位置对应的特征进行拼接。

在一些实施例中,步骤S1具体包括:将实体在三元组中的位置和实体类型插入语句中的实体的前后位置。

在一些实施例中,实体进行信息增强后的结构为:PT实体[PT],其中P表示实体在三元组中的位置,T表示实体类型。

在一些实施例中,在步骤S1之前还包括:采用已收集的语料信息训练word2vec模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110602654.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top