[发明专利]命名体类型识别方法和装置以及电子设备有效
申请号: | 201910036941.3 | 申请日: | 2019-01-15 |
公开(公告)号: | CN111435411B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 郭东波;邵宇 | 申请(专利权)人: | 菜鸟智能物流控股有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 类型 识别 方法 装置 以及 电子设备 | ||
1.一种命名体类型识别方法,其特征在于,包括:
获取命名体字数据,其中,所述命名体字数据包括与命名体文本中的每个字对应的字向量;
获取预先设置的类型标签数据,其中,所述类型标签数据包括与每个类型标签对应的标签向量,所述类型标签用于标识所述命名体文本中的每个字在相应命名体类型中的位置信息;
对所述命名体字数据和所述类型标签数据进行字标签匹配处理,生成字标签对数据,所述字标签对数据包括与所述字和所述类型标签对应的字标签向量;
根据所述字标签对数据中的各所述字标签向量,生成用于标识所述字向量与所述标签向量的匹配概率的第一概率矩阵;
根据所述第一概率矩阵对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列;
根据所述标签序列,确定命名体类型。
2.根据权利要求1所述的命名体类型识别方法,其特征在于,还包括:
根据所述字标签对数据中的各所述字标签向量,生成用于标识各所述字标签向量间顺序关系的第二概率矩阵;
所述根据所述第一概率矩阵对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列,具体包括:
根据所述第一概率矩阵和所述第二概率矩阵,对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列。
3.根据权利要求1所述的命名体类型识别方法,其特征在于,所述根据所述字标签对数据中的各所述字标签向量,生成用于标识所述字向量与所述标签向量的匹配概率的第一概率矩阵,包括:
采用循环神经网络对所述字标签对数据中的各所述字标签向量进行处理,生成所述第一概率矩阵。
4.根据权利要求2所述的命名体类型识别方法,其特征在于,所述根据所述字标签对数据中的各所述字标签向量,生成用于标识各所述字标签向量间顺序关系的第二概率矩阵,包括:
采用序列标注模型对所述字标签对数据中的各所述字标签向量进行处理,生成所述第二概率矩阵。
5.根据权利要求1所述的命名体类型识别方法,其特征在于,所述根据所述第一概率矩阵对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列,包括:
根据所述第一概率矩阵,采用维特比算法,对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列。
6.根据权利要求2所述的命名体类型识别方法,其特征在于,所述根据所述第一概率矩阵和所述第二概率矩阵,对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列,包括:
根据所述第一概率矩阵和所述第二概率矩阵,采用维特比算法,对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列。
7.根据权利要求1至6中任一权利要求所述的命名体类型识别方法,其特征在于,所述获取命名体字数据,具体包括:
对命名体文本进行词嵌入处理,获取命名体字数据。
8.根据权利要求7所述的命名体类型识别方法,其特征在于,在所述对命名体文本进行词嵌入处理,获取命名体字数据之前,还包括:
对原始命名体文本进行预处理,获取可进行词嵌入处理的命名体文本。
9.根据权利要求1至6中任一权利要求所述的命名体类型识别方法,其特征在于,当根据所述标签序列确定的命名体类型的数量为多个时,所述方法还包括:
采用词标注模型对多个所述命名体类型进行处理,获取核心命名体类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菜鸟智能物流控股有限公司,未经菜鸟智能物流控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910036941.3/1.html,转载请声明来源钻瓜专利网。