[发明专利]文本实体识别方法及其装置、设备、介质、产品在审
申请号: | 202111628410.7 | 申请日: | 2021-12-28 |
公开(公告)号: | CN114330346A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 吴智东 | 申请(专利权)人: | 广州华多网络科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 实体 识别 方法 及其 装置 设备 介质 产品 | ||
1.一种文本实体识别方法,其特征在于,包括:
读取待识别的文本信息;
将所述文本信息输入至预设的学生模型中,其中,所述学生模型基于预设的教师模型通过知识蒸馏训练至收敛状态,用于提取所述文本信息的首指针向量和尾指针向量,且所述学生模型的模型规模小于所述教师模型的模型规模;
读取所述学生模型输出的所述首指针向量和尾指针向量,并根据所述首指针向量和尾指针向量对应的实体属性映射表,对所述文本信息进行实体抽取生成实体信息和实体属性信息;
根据所述实体信息和实体属性信息生成所述文本信息的识别结果。
2.根据权利要求1所述的文本实体识别方法,其特征在于,所述读取待识别的文本信息之前,包括:
采集待处理的样本文本;
对所述样本文本进行分词处理生成样本实体;
根据所述样本实体的中首字符和尾字符出现的位置,以及所述样本实体在所述实体属性映射表中的映射值,生成所述样本文本的标注首指针向量和标注尾指针向量;
根据所述标注首指针向量、标注尾指针向量和样本文本构建训练样本;
根据所述训练样本对所述学生模型和/或教师模型进行模型训练。
3.根据权利要求2所述的文本实体识别方法,其特征在于,所述训练样本用于对所述教师模型进行模型训练,所述根据所述训练样本对所述学生模型和/或教师模型进行模型训练包括:
将所述样本文本输入至所述教师模型的初始教师模型中,其中,所述初始教师模型为所述教师模型的非收敛状态;
读取所述初始教师模型输出的第一首指针向量和第一尾指针向量;
计算所述标注首指针向量和第一首指针向量之间的第一损失值,以及所述标注尾指针向量和第一尾指针向量之间的第二损失值;
根据所述第一尾指针向量之间的第二损失值对所述初始教师模型的模型参数进行回传校正。
4.根据权利要求2所述的文本实体识别方法,其特征在于,所述根据所述训练样本对所述学生模型和/或教师模型进行模型训练包括:
将所述训练样本分别输入至所述教师模型和所述学生模型的初始学生模型中,其中,所述初始学生模型为所述学生模型的非收敛状态;
读取所述教师模型的输出的教师特征向量,以及所述初始学生模型输出的学生特征向量;
计算所述教师特征向量和所述学生特征向量之间的蒸馏损失。
5.根据权利要求4所述的文本实体识别方法,其特征在于,所述教师特征向量包括:教师特征编码向量、第二首指针向量和第二尾指针向量,所述学生特征向量包括:学生特征编码向量、第三首指针向量和第三尾指针向量;所述计算所述教师特征向量和所述学生特征向量之间的蒸馏损失包括:
分别计算所述第三首指针向量和标注首指针向量之间的第一交叉熵损失值,以及所述第三尾指针向量和标注尾指针向量之间的第二交叉熵损失值;
分别计算所述第二首指针向量和第三首指针向量之间的第一散度损失值,以及所述第二尾指针向量和第三尾指针向量之间的第二散度损失值;
计算所述教师特征编码向量和所述学生特征编码向量之间的第三散度损失值;
根据所述第一交叉熵损失值、第一散度损失值、第二交叉熵损失值、第二散度损失值和第三散度损失值生成所述蒸馏损失。
6.根据权利要求5所述的文本实体识别方法,其特征在于,所述计算所述教师特征向量和所述学生特征向量之间的蒸馏损失之后,包括:
构建所述训练样本的负样本;
将所述训练样本输入至所述教师模型和所述初始学生模型中,生成第一联合特征集;
将所述训练样本二次输入至所述初始学生模型中,并结合所述第一联合特征集中的学生模型特征,生成第二联合特征集;
将所述负样本输入至所述初始学生模型中,并结合所述第一联合特征集中的学生模型特征,生成第三联合特征集;
计算所述第一联合特征集和所述第三联合特征集之间的第一比对损失值,以及所述第二联合特征集和所述第三联合特征集之间的第二比对损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111628410.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据协同初始化方法及其装置、设备、介质
- 下一篇:一种血液气泡监测模块及方法