[发明专利]一种命名实体识别方法及装置在审
申请号: | 201810971954.5 | 申请日: | 2018-08-23 |
公开(公告)号: | CN109165384A | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 王伟才;王纯斌;赵神州;覃进学;王升升 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种命名实体识别方法及装置。方法包括获取待识别文本;将待识别文本输入字嵌入模型获得待识别文本中每个字对应的字向量,以及将待识别文本输入拼音嵌入模型获得每个字对应的拼音向量;将每个字向量和对应的拼音向量进行组合获得组合向量,将所有的字的组合向量输入BiLSTM中进行语义编码,获得待识别文本对应的语义信息特征;根据语义信息特征获得待识别文本中对应的实体标签序列。装置用于执行上述方法,本发明实施例通过根据字嵌入模型和拼音向量模型分别得到待识别文本的字向量和拼音向量,并将字向量和拼音向量进行组合输入到BiLSTM中进行识别,从而能够很好的弥补字向量表示的不足,使得识别的准确率大大提高。 | ||
搜索关键词: | 向量 文本 拼音 嵌入 命名实体 模型获得 语义信息 组合向量 实体标签 输入拼音 特征获得 向量表示 向量模型 语义编码 输入字 准确率 | ||
【主权项】:
1.一种命名实体识别方法,其特征在于,包括:获取待识别文本,所述待识别文本包括多个字;将所述待识别文本输入字嵌入模型中获得所述待识别文本中每个字对应的字向量,以及将所述待识别文本输入拼音嵌入模型中,获得每个字对应的拼音向量;将每个字向量和对应的拼音向量进行组合获得组合向量,将所有的字分别对应的组合向量输入双向长短时记忆网络BiLSTM中进行语义编码,获得所述待识别文本对应的语义信息特征;根据所述语义信息特征获得所述待识别文本中对应的实体标签序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810971954.5/,转载请声明来源钻瓜专利网。