[发明专利]中文命名实体识别方法、装置、设备及存储介质在审
申请号: | 202210453919.0 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114861664A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 李雅琴;陈子旋;袁操;胡婧 | 申请(专利权)人: | 武汉轻工大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/33;G06F16/34;G06N7/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 袁雪 |
地址: | 430000 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 命名 实体 识别 方法 装置 设备 存储 介质 | ||
1.一种中文命名实体识别方法,其特征在于,所述中文命名实体识别方法包括:
在接收到中文命名实体识别请求时,根据所述中文命名实体识别请求确定对应的文本信息;
提取所述文本信息中的单句文本,并确定所述单句文本对应的特征向量表示层;
将所述特征向量表示层通过预设中文命名实体识别模型进行实体识别,获得中文命名实体识别结果;
将所述中文命名实体识别结果发送至客户端进行展示。
2.如权利要求1所述的中文命名实体识别方法,其特征在于,所述将所述特征向量表示层通过预设中文命名实体识别模型进行实体识别,获得中文命名实体识别结果,包括:
将所述特征向量表示层通过预设评分模型进行标签评分,获得字符得分矩阵;
根据所述字符得分矩阵、转移分数矩阵以及预设标签序列确定所述单句文本的字符标签信息,并根据所述字符标签信息确定目标字符序列;
将所述目标字符序列记为中文命名实体识别结果。
3.如权利要求2所述的中文命名实体识别方法,其特征在于,所述将所述特征向量表示层通过预设评分模型进行标签评分,获得字符得分矩阵,包括:
将所述特征向量表示层进行解析,获得上下文表示向量;
对所述上下文表示向量进行非线性变换,获得字符得分矩阵。
4.如权利要求2所述的中文命名实体识别方法,其特征在于,所述根据所述字符得分矩阵、转移分数矩阵以及预设标签序列确定所述单句文本的字符标签信息,并根据所述字符标签信息确定目标字符序列,包括:
根据所述字符得分矩阵、所述转移分数矩阵以及预设标签序列确定目标字符的标签转移得分;
预测所述标签转移得分的转移概率;
根据所述转移概率确定所述单句文本的字符标签信息,并根据所述字符标签信息确定目标字符序列。
5.如权利要求4所述的中文命名实体识别方法,其特征在于,所述预测所述标签转移得分的转移概率,包括:
获取初始标注序列与实际标注序列;
根据所述初始标注序列、实际标注序列以及所述标签转移得分确定转移概率。
6.如权利要求1-5任一项所述的中文命名实体识别方法,其特征在于,所述确定所述单句文本对应的特征向量表示层,包括:
获取所述单句文本中的字符向量、二元词组向量、映射向量以及上下文特征向量;
根据所述字符向量、所述二元词组向量、所述映射向量以及所述上下文特征向量生成特征向量表示层。
7.如权利要求6所述的中文命名实体识别方法,其特征在于,所述获取所述单句文本中的字符向量、二元词组向量、映射向量以及上下文特征向量,包括:
获取所述单句文本中的字符信息;
根据预设字符向量映射表查询所述字符信息对应的字符向量;
获取所述字符信息的下一字符信息,并根据所述字符信息与所述下一字符信息通过二元词组向量映射表获得二元词组向量;
获取所述字符信息对应的单词集集合,并确定所述单词集集合对应的向量集合,根据所述向量集合生成映射向量;
将所述字符信息通过预设编码器获得所述字符信息对应的上下文特征向量。
8.一种中文命名实体识别装置,其特征在于,所述中文命名实体识别装置包括:
信息获取模块,用于在接收到中文命名实体识别请求时,根据所述中文命名实体识别请求确定对应的文本信息;
向量获取模块,用于提取所述文本信息中的单句文本,并确定所述单句文本对应的特征向量表示层;
实体识别模块,用于将所述特征向量表示层通过预设中文命名实体识别模型进行实体识别,获得中文命名实体识别结果;
结果展示模块,用于将所述中文命名实体识别结果发送至客户端进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉轻工大学,未经武汉轻工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210453919.0/1.html,转载请声明来源钻瓜专利网。