[发明专利]一种基于ALBERT的武器装备实体抽取方法、系统及存储介质在审
申请号: | 202110163970.3 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112966510A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 高佩东;赵彤洲 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 albert 武器装备 实体 抽取 方法 系统 存储 介质 | ||
1.一种基于ALBERT的武器装备实体抽取方法,其特征在于,包括以下步骤:
S1、使用ALBERT模型作为语句表征模型来表示句向量,将预设的训练集语句统合为多维向量特征作为神经网络输入,并将训练集语句对应的实体标记通过one-hot编码得到对照结果向量特征;
S2、将对照结果向量特征输入BiLSTM-CRF网络模型,对对照结果向量特征进行交叉训练,等待BiLSTM-CRF网络模型收敛后得到网络模型;
S3、输入待识别语句至ALBERT模型,通过ALBERT模型表示为句向量,并作为特征输入到网络模型中;
S4、通过网络模型计算得到预测结果;
S5、将预测结果通过反one-hot编码得到结果序列,识别结果序列得到实体名称和实体位置;
S6、将实体名称和实体位置作为最终结果输出。
2.根据权利要求1所述的一种基于ALBERT的武器装备实体抽取方法,其特征在于,所述S1具体为:
S1.1、规定进入ALBERT模型的待识别语句长度为80,如果待识别语句长度小于80,使用0作为填充至待识别语句长度为80;如果待识别语句长度大于80,则将该待识别语句截断至待识别语句长度为80;
S1.2、以字符为单位将待识别语句分开,每个字符作为一个token,将各待识别语句输入ALBERT模型中并转化为句向量;
S1.3、将训练集中的每一条训练集语句均按照S1.1、S1.2的步骤处理得到多维向量特征;
S1.4、使用one-hot编码对每一条训练集语句对应的实体标记进行编码,得到对照结果向量特征。
3.根据权利要求1所述的一种基于ALBERT的武器装备领域实体抽取方法,其特征在于,所述S2中交叉训练的具体方法为:
S2.1、通过Pytorch神经网络框架实现双向长短时序网络和条件随机场,即BiLSTM-CRF网络模型;
S2.2、设置神经网络相关参数,将对照结果向量特征输入BiLSTM-CRF网络模型进行迭代训练;
S2.3、随着迭代次数增加,当loss值小于阈值时停止训练,得到网络模型参数并存储。
4.根据权利要求1所述的一种基于ALBERT的武器装备实体抽取方法,其特征在于,所述S5具体为:
S5.1、将预测结果标准化,即将预测结果中的小数进行四舍五入取整;
S5.2、将标准化后的预测结果通过反one-hot编码得到实体名称和实体位置,即将结果中的数字映射到实体名称。
5.根据权利要求1所述的一种基于ALBERT的武器装备实体抽取方法,其特征在于,所述S6还包括以下步骤:将实体名称和实体位置整合为实体结果后输出。
6.一种使用如权利要求1所述的一种基于ALBERT的武器装备实体抽取方法的系统,其特征在于,包括:
ALBERT模型模块,用于作为语句表征模型来表示句向量,将预设的训练集语句统合为多维向量特征作为神经网络输入,并将训练集语句对应的实体标记通过one-hot编码得到对照结果向量特征;
BiLSTM-CRF网络模型模块,用于对对照结果向量特征进行交叉训练,等待BiLSTM-CRF网络模型收敛后得到网络模型;
网络模型模块,用于通过网络模型对句向量计算得到预测结果,将预测结果通过反one-hot编码得到结果序列,识别结果序列得到实体名称和实体位置,并将实体名称和实体位置作为最终结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163970.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纳米氧化锆分散液的分析方法
- 下一篇:一种面对称型两转动一移动并联机构