[发明专利]命名实体识别方法、装置、设备及介质在审
申请号: | 201911124011.X | 申请日: | 2019-11-15 |
公开(公告)号: | CN111222334A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 姚志强;周曦;李继伟;杜晓薇;郝东;赵云 | 申请(专利权)人: | 广州洪荒智能科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
地址: | 511458 广东省广州市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 设备 介质 | ||
1.一种命名实体识别方法,其特征在于,包括:
获取用户输入的基于自然语言的对话;
预处理所述对话内的语料信息;
利用预先训练好的命名实体模型识别所述语料信息得到相应的命名实体。
2.根据权利要求1所述的命名实体识别方法,其特征在于,所述命名实体模型的训练过程包括:
将训练样本内的语料信息对应的原始输入序列生成以嵌入向量表达的输入序列;
构建生成输入序列特征的命名实体特征生成模型;
构建生成预测的命名实体序列的命名实体模型。
3.根据权利要求2所述的命名实体识别方法,其特征在于,所述将原始输入序列生成以嵌入向量表达的输入序列的步骤,包括:
将所述训练样本内的语料信息对应的原始输入序列切分为字、词或多个语法单位;
根据时间序列采用单种或多种粒度组合输入序列;
基于语义嵌入、字形嵌入或字音嵌入中任一维或几维提取所述输入序列每个单位;
融合多种嵌入类型的生成所述输入序列的嵌入向量。
4.根据权利要求3所述的命名实体识别方法,其特征在于,采用深度卷积神经网络提取输入序列每个的单位的字形嵌入。
5.根据权利要求3所述的命名实体识别方法,其特征在于,采用循环神经网络、长短期记忆网络或递归神经网络中任一方式提取输入序列每个的单位的字音嵌入。
6.根据权利要求2所述的命名实体识别方法,其特征在于,所述命名实体特征生成模型采用双向长短记忆网络或Transformer模型进行训练。
7.根据权利要求2所述的命名实体识别方法,其特征在于,采用条件随机场算法模型为基础,利用最大似然估计算法进行训练,得到生成预测的命名实体序列的命名实体模型。
8.一种命名实体识别装置,其特征在于,包括:
对话获取模块,用于获取用户输入的基于自然语言的对话;
预处理模块,用于预处理所述对话内的语料信息;
命名实体识别模块,利用预先训练好的命名实体模型识别所述语料信息得到相应的命名实体。
9.根据权利要求8所述的命名实体识别装置,其特征在于,所述命名实体模块包括:
嵌入向量生成单元,用于将训练样本内的语料信息对应的原始输入序列生成以嵌入向量表达的输入序列;
命名实体特征生成单元,用于构建生成输入序列特征的命名实体特征生成模型;
命名实体判别单元,用于构建生成预测的命名实体序列的命名实体模型。
10.根据权利要求9所述的命名实体识别装置,其特征在于,所述嵌入向量生成单元包括:
切分子单元,用于将训练样本内的语料信息对应的原始输入序列切分为字、词或多个语法单位;
序列组合子单元,用于根据时间序列采用单种或多种粒度组合输入序列;
嵌入提取子单元,用于基于语义嵌入、字形嵌入或字音嵌入中任一维或几维提取所述输入序列每个单位;
向量输出子单元,用于融合多种嵌入类型的生成所述输入序列的嵌入向量。
11.根据权利要求10所述的命名实体识别装置,其特征在于,采用深度卷积神经网络提取输入序列每个的单位的字形嵌入。
12.根据权利要求10所述的命名实体识别装置,其特征在于,采用循环神经网络、长短期记忆网络或递归神经网络中任一方式提取输入序列每个的单位的字音嵌入。
13.根据权利要求9所述的命名实体识别装置,其特征在于,所述命名实体特征生成模型采用双向长短记忆网络或Transformer模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州洪荒智能科技有限公司,未经广州洪荒智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911124011.X/1.html,转载请声明来源钻瓜专利网。