[发明专利]实体关系的处理方法、装置、设备及计算机可读存储介质有效
申请号: | 201910414289.4 | 申请日: | 2019-05-17 |
公开(公告)号: | CN111950279B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 范淼;白也淇;孙明明;李平 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 处理 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明提供一种实体关系的处理方法、装置、设备及计算机可读存储介质。本发明实施例由于利用了少量的标注数据即不常见的一些实体关系类别下的少量标注样本,并且增加了更加细粒度的分段特征来表征待处理的文本,使得能够基于不常见的实体关系的少量标注样本准确地预测出文本中所存在的不常见的实体关系,从而提高了少量不常见的实体关系的识别准确率。
【技术领域】
本发明涉及实体关系识别技术,尤其涉及一种实体关系的处理方法、装置、设备及计算机可读存储介质。
【背景技术】
有效的实体关系识别算法可以帮助机器理解自然语言的内部结构,同时也是拓展知识库或者补全知识图谱的重要手段。现有的实体关系识别算法的共同缺陷是对大量标注数据的高度依赖。因此,以上的算法往往只能在大量常见的实体关系上产生较高的识别准确率,而在一些少量不常见的实体关系上则只能得到较低的识别准确率。
因此,亟需提供一种实体关系的处理方法,用以提高少量不常见的实体关系的识别准确率。
【发明内容】
本发明的多个方面提供一种实体关系的处理方法、装置、设备及计算机可读存储介质,用以提高少量不常见的实体关系的识别准确率。
本发明的一方面,提供一种实体关系的处理方法,包括:
利用第一神经网络,对待处理的文本进行特征提取处理,以获得所述文本的初始特征向量;
将所述文本进行分段处理,以获得所述文本的至少两个分段;
利用至少一个第二神经网络,对所述文本的至少两个分段中每个分段进行特征提取处理,以获得所述文本的每个分段的特征向量;
根据所述文本的初始特征向量和所述文本的每个分段的特征向量,获得所述文本的优化特征向量;
根据至少两个第一实体关系类别中每个第一实体关系类别的优化特征向量和所述文本的优化特征向量,利用第三神经网络,获得所述文本中所存在的第一实体关系类别。
本发明的另一方面,提供一种实体关系的处理装置,包括:
第一特征提取单元,用于利用第一神经网络,对待处理的文本进行特征提取处理,以获得所述文本的初始特征向量;
第二特征提取单元,用于将所述文本进行分段处理,以获得所述文本的至少两个分段;以及利用至少一个第二神经网络,对所述文本的至少两个分段中每个分段进行特征提取处理,以获得所述文本的每个分段的特征向量;
特征处理单元,用于根据所述文本的初始特征向量和所述文本的每个分段的特征向量,获得所述文本的优化特征向量;
关系识别单元,用于根据至少两个第一实体关系类别中每个第一实体关系类别的优化特征向量和所述文本的优化特征向量,利用第三神经网络,获得所述文本中所存在的第一实体关系类别。
本发明的另一方面,提供一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述一方面所提供的实体关系的处理方法。
本发明的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面所提供的实体关系的处理方法。
本发明的另一方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910414289.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:换热系统和车辆
- 下一篇:一种WIFI热点的共享方法及装置