[发明专利]一种基于深度神经网络的信息抽取方法有效

专利信息
申请号: 202210719139.6 申请日: 2022-06-23
公开(公告)号: CN115130462B 公开(公告)日: 2023-09-01
发明(设计)人: 王亚强;李凯伦;唐聃;舒红平 申请(专利权)人: 成都信息工程大学
主分类号: G06F40/216 分类号: G06F40/216;G06N3/0442;G06N3/045;G06N3/047;G06N3/084;G06N3/088;G06N3/09
代理公司: 北京元本知识产权代理事务所(普通合伙) 11308 代理人: 曹广生
地址: 610225 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 神经网络 信息 抽取 方法
【权利要求书】:

1.一种基于深度神经网络的信息抽取方法,其特征在于,包括无监督域内继续预训练和基于批量过采样的有监督训练;

所述信息为中医临床四诊信息;

所述方法包括以下步骤:

S1:对开放域预训练语言模型BERT的掩码语言模型(Masked Language Model,MLM)进行无监督域内继续预训练;

S2:将S1中域内继续预训练之后的BERT模型与BiLSTM-CRF模型组合成BERT-BiLSTM-CRF模型;

S3:对BERT-BiLSTM-CRF模型进行有监督训练;

所述批量过采样处理流程包括批处理策略、按比例P随机移除、随机选取、插入;

所述批量过采样处理流程的具体步骤为:

a)批处理策略:首先,将训练数据集D中所有的数据样本(xi,yi)按洗牌算法随机排列到列表中。然后,使用批量大小为M的滑动窗口去将列表划分为批量集合B,批量集合B中的批量Bk的数量批量Bk的大小为M,即:一个批量Bk中包含M个数据样本(xi,yi);

b)按比例P随机移除:针对步骤a)中生成的每一个批量Bk,按批量过采样比例P随机从Bk中移除个数据样本(xi,yi);

c)随机选取:从少数类样本信息数据集W中有放回地随机选取个数据样本,与步骤b)中在每个批量Bk中随机移除的数据样本数量相等;

d)插入:针对步骤b)中处理后的每一个批量Bk,将步骤c)中生成的个数据样本插入批量Bk中,形成批量过采样后的批量B'k,其中,批量集合B'中批量B'k的数量N'与批量集合B中批量Bk的数量N相等,即:所述步骤S2中BERT-BiLSTM-CRF模型,输入层将训练数据按字粒度进行分词,然后输入BERT层进行特征提取,BERT模型对输入的序列进行多种不同的线性变换,得到多个不同的Attention结果,并通过多头注意力机制将不同线性变换得到的Attention结果拼接起来,得到每个词在不同空间下的位置信息,从而给BERT层输出的词向量注入丰富的上下文语境信息;BiLSTM层的前向过程和后向过程的LSTM单元可以舍弃当前时刻输入词向量的无用信息,并将当前时刻输入词向量的有用信息传递给下一时刻的LSTM单元,然后,将双向过程中每个时刻对应的输出拼接,得到包含长距离上下文信息的词向量;CRF模型利用邻近标签之间的依赖关系对BiLSTM层输出的所有词向量进行解码,从而得到最优的预测序列;

所述步骤c)中所述的少数类样本信息数据集W为闻诊信息数据集,由训练数据集D中所有包含闻诊信息的数据样本构成。

2.根据权利要求1所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述S3中通过小批量梯度下降方法对BERT-BiLSTM-CRF模型进行有监督训练。

3.根据权利要求2所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述S3中对BERT-BiLSTM-CRF模型进行有监督训练的数据集是经过批量过采样处理的标注数据。

4.根据权利要求1所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述步骤c)针对步骤b)中处理后的的每一个批量Bk都会重新执行一次。

5.根据权利要求4所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述批量大小M,批量过采样比例P都为模型训练过程中的超参。

6.根据权利要求4所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述批量过采样流程在训练模型的过程中会多次执行,执行次数与模型训练过程中的超参Epochs相等。

7.根据权利要求1所述的一种基于深度神经网络的信息抽取方法,其特征在于,所述步骤S2中BERT-BiLSTM-CRF模型组合的方法为,将无监督域内继续预训练后的BERT模型与BiLSTM模型相组合,用于输入序列的特征提取,并在其末尾组合一个用于抽取信息的CRF模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210719139.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top