[发明专利]命名实体识别方法、装置及计算机可读存储介质有效
申请号: | 201910825074.1 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110688854B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种命名实体识别方法,其特征在于,所述方法包括:
接收由待识别的原始语句组成的第一文本数据,并对所述第一文本数据进行预处理得到文本向量数据;
获取具有多层结构的神经实体推理机识别模型,所述神经实体推理机识别模型的每一层结构通过Bi-LSTM模型进行编码,并通过解码器进行解码,解码完成后的数据进入下一层结构再次进行编码和解码;
将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合,其中,所述神经实体推理机识别模型中的各层结构共享参数,所述将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合包括:输入经过预处理的所述文本向量数据;利用所述Bi-LSTM模型对所述文本向量数据进行编码,得到编码表示序列和初始命名实体,将所述初始命名实体加入候选池;将所述编码表示序列和所述候选池中的所述初始命名实体输入所述神经实体推理机识别模型中的推理机中进行处理,得到引用信息;将所述编码表示序列和所述引用信息输入解码器,得到预测标签,根据所述预测标签更新所述候选池,得到所述命名实体集合;
将所述文本向量数据和所述命名实体集合输入所述神经实体推理机识别模型中的推理机进行推理,得到命名实体。
2.如权利要求1所述的命名实体识别方法,其特征在于,所述解码器包括:
其中,X表示经过上述预处理的所述文本向量数据,y表示经过所述神经实体推理机识别模型训练后得到的所述预测标签,yi表示所述神经实体推理机识别模型中第i层的预测标签,xt表示在t时刻文本向量x的值。
3.如权利要求1~2中任一项所述的命名实体识别方法,其特征在于,所述对所述第一文本数据进行预处理得到文本向量数据包括:
对所述第一文本数据进行分词操作得到第二文本数据,对所述第二文本数据进行去停用词操作得到第三文本数据,对所述第三文本数据进行去重操作得到第四文本数据;
对所述第四文本数据利用TF-IDF算法进行词向量形式转化,得到所述文本向量数据。
4.一种命名实体识别装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的命名实体识别程序,所述命名实体识别程序被所述处理器执行时实现如下步骤:
接收由待识别的原始语句组成的第一文本数据,并对所述第一文本数据进行预处理得到文本向量数据;
获取具有多层结构的神经实体推理机识别模型,所述神经实体推理机识别模型的每一层结构通过Bi-LSTM模型进行编码,并通过解码器进行解码,解码完成后的数据进入下一层结构再次进行编码和解码;
将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合,其中,所述神经实体推理机识别模型中的各层结构共享参数,所述将所述文本向量数据输入所述神经实体推理机识别模型进行训练得到命名实体集合包括:输入经过预处理的所述文本向量数据;利用所述Bi-LSTM模型对所述文本向量数据进行编码,得到编码表示序列和初始命名实体,将所述初始命名实体加入候选池;将所述编码表示序列和所述候选池中的所述初始命名实体输入所述神经实体推理机识别模型中的推理机中进行处理,得到引用信息;将所述编码表示序列和所述引用信息输入解码器,得到预测标签,根据所述预测标签更新所述候选池,得到所述命名实体集合;
将所述文本向量数据和所述命名实体集合输入所述神经实体推理机识别模型中的推理机进行推理,得到命名实体。
5.如权利要求4所述的命名实体识别装置,其特征在于,所述解码器包括:
其中,X表示经过上述预处理的所述文本向量数据,y表示经过所述神经实体推理机识别模型训练后得到的所述预测标签,yi表示所述神经实体推理机识别模型中第i层的预测标签,xt表示在t时刻文本向量x的值。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有命名实体识别程序,所述命名实体识别程序可被一个或者多个处理器执行,以实现如权利要求1至3中任一项所述的命名实体识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910825074.1/1.html,转载请声明来源钻瓜专利网。