[发明专利]一种基于Bi-LSTM-CRF模型的命名实体识别方法和装置有效
申请号: | 201810369183.2 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108920445B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 莫益军;姚澜;杨帆 | 申请(专利权)人: | 华中科技大学鄂州工业技术研究院;华中科技大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 436000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于Bi‑LSTM‑CRF模型的命名实体识别方法和装置,对自然语言进行数据预处理,在训练情况下,将输入的第一自然语言进行分隔,获得第一字符序列;根据所述第一字符序列中的各个字符做映射,获得向量矩阵,将所述向量矩阵输入Bi‑LSTM模块;将Bi‑LSTM模块的所述发射矩阵输入CRF层形成Bi‑LSTM‑CRF模型,所述Bi‑LSTM‑CRF模型对所述自然语言进行整句实体识别;其中,根据交叉检验确定所述Bi‑LSTM‑CRF模块的超参数。解决现有技术中的模型无法考虑长远的上下文信息,无法对这些依赖关系进行建模,从而使得识别的准确率受到限制的技术问题,达到了直接将原始语句输入模型就可以提取出语句中的命名实体,适应性强,适用面广,提高对实体识别的准确率的技术效果。 | ||
搜索关键词: | 一种 基于 bi lstm crf 模型 命名 实体 识别 方法 装置 | ||
【主权项】:
1.一种基于Bi‑LSTM‑CRF模型的命名实体识别方法,其特征在于,所述方法包括:对自然语言进行数据预处理,在训练情况下,将输入的第一自然语言进行分隔,获得第一字符序列;在预测情况下,将输入的第二自然语言进行分隔,获得第二字符序列,根据比对所述第二字符序列与所述第一字符序列,将所述第二字符序列中不存在于所述第一字符序列的字符归为未登录字符;根据所述第一字符序列中的各个字符做映射,获得向量矩阵,其中,所述向量矩阵包括所述各个字符对应的维度固定的向量;将所述向量矩阵输入Bi‑LSTM模块,分别对所述Bi‑LSTM模块里的前向LSTM模块和后向LSTM模块进行从前向后、从后向前的向量序列非线性变换,且结合所述前向LSTM模块和后向LSTM模块的输出结果,其中所述输出结果为发射矩阵;将Bi‑LSTM模块的所述发射矩阵输入CRF层形成Bi‑LSTM‑CRF模型,所述Bi‑LSTM‑CRF模型对所述自然语言进行整句实体识别;其中,根据交叉检验确定所述Bi‑LSTM‑CRF模块的超参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学鄂州工业技术研究院;华中科技大学,未经华中科技大学鄂州工业技术研究院;华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810369183.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种凹版印刷制版的印前排版方法
- 下一篇:一种面向特定领域的中文事件抽取方法