[发明专利]命名体类型识别方法和装置以及电子设备有效
申请号: | 201910036941.3 | 申请日: | 2019-01-15 |
公开(公告)号: | CN111435411B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 郭东波;邵宇 | 申请(专利权)人: | 菜鸟智能物流控股有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 类型 识别 方法 装置 以及 电子设备 | ||
本发明实施例提供了一种命名体类型识别方法和装置以及电子设备。该方法包括:获取命名体字数据;获取预先设置的类型标签数据;对所述命名体字数据和所述类型标签数据进行字标签匹配处理,生成字标签对数据;根据所述字标签对数据中的各字标签向量,生成用于标识所述字向量与所述标签向量的匹配概率的第一概率矩阵;根据所述第一概率矩阵对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列;根据所述标签序列,确定命名体类型。本发明实施例不依赖于预先建立的标准,避免了对命名体文本进行分词处理,提高了命名体类型识别的准确性。
技术领域
本发明涉及通信技术领域,尤其涉及一种命名体类型识别方法和装置以及电子设备。
背景技术
在快递行业,用户对智能配送的需求越来越多,针对不同地址类型的配送地址,用户会要求不同的配送体验。例如,针对普通住宅,要求送货上门;针对写字楼,要求工作日配送;或者,针对小区和别墅,要求避免明文透露私密信息等。因此,对地址类型的识别尤为重要。
地址作为一种具有特定意义的命名体,可以采用命名体类型识别的方式识别地址类型。目前通常采用的方式有:1、预先人工挖掘出命名体文本中代表命名体类型的后缀,建立后缀数据库,然后通过后缀匹配的方式识别命名体文本的命名体类型;2、预先通过训练数据建立分类模型,然后对命名体文本进行分词处理,将分词后的词作为命名体文本的分类特征,输入到分类模型中以判断命名体类型。
发明人在实现本发明的过程中,发现现有技术至少存在如下问题:现有的命名体类型识别方式都依赖于预先建立的标准(如,预先建立的后缀数据库,或预先建立的分类模型),并且需要确保分词的准确性,存在极大的限制性,如果预先建立的标准或者分词不准确,则影响命名体类型识别的准确性。
发明内容
本发明实施例提供一种命名体类型识别方法和装置以及电子设备,以解决现有技术中命名体类型识别方式依赖于预先建立的标准和分词准确性的缺陷。
为达到上述目的,本发明实施例提供了一种命名体类型识别方法,包括:
获取命名体字数据,其中,所述命名体字数据包括与命名体文本中的每个字对应的字向量;
获取预先设置的类型标签数据,其中,所述类型标签数据包括与每个类型标签对应的标签向量,所述类型标签用于标识所述命名体文本中的每个字在相应命名体类型中的位置信息;
对所述命名体字数据和所述类型标签数据进行字标签匹配处理,生成字标签对数据,所述字标签对数据包括与所述字和所述类型标签对应的字标签向量;
根据所述字标签对数据中的各所述字标签向量,生成用于标识所述字向量与所述标签向量的匹配概率的第一概率矩阵;
根据所述第一概率矩阵对由所述字标签向量组成的字标签向量序列进行解码处理,生成标签序列;
根据所述标签序列,确定命名体类型。
本发明实施例还提供了一种命名体类型识别装置,包括:
第一获取模块,用于获取命名体字数据,其中,所述命名体字数据包括与命名体文本中的每个字对应的字向量;
第二获取模块,用于获取预先设置的类型标签数据,其中,所述类型标签数据包括与每个类型标签对应的标签向量,所述类型标签用于标识所述命名体文本中的每个字在相应命名体类型中的位置信息;
匹配处理模块,用于对所述命名体字数据和所述类型标签数据进行字标签匹配处理,生成字标签对数据,所述字标签对数据包括与所述字和所述类型标签对应的字标签向量;
第一概率矩阵生成模块,用于根据所述字标签对数据中的各所述字标签向量,生成用于标识所述字向量与所述标签向量的匹配概率的第一概率矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菜鸟智能物流控股有限公司,未经菜鸟智能物流控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910036941.3/2.html,转载请声明来源钻瓜专利网。