[发明专利]一种基于深度学习的古文预训练系统及其训练方法在审
申请号: | 202011094231.5 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112163410A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 吕建成;田荟双;杨可心;屈茜;彭玺;刘权辉 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F40/151;G06F40/166;G06N3/04;G06N3/08 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 李林合 |
地址: | 610064 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 古文 训练 系统 及其 方法 | ||
1.一种基于深度学习的古文预训练系统,其特征在于,包括预处理模块以及预训练模块;
所述预处理模块,用于获取预训练的古文数据,并对所述古文数据进行预处理;
所述预训练模块,用于根据所述预处理后的古文数据以及BERT-base模型,利用完形填空任务训练得到古文预训练模型,完成对基于深度学习的古文预训练系统的训练。
2.一种如权利要求1所述的基于深度学习的古文预训练系统的训练方法,其特征在于,包括以下步骤:
S1、获取预训练的古文数据,并对所述古文数据进行预处理;
S2、利用BERT-base模型对古文预训练模型的参数进行初始化处理,并将BERT-base模型中的中文词汇表作为古文预训练模型的词汇表;
S3、根据预处理后的古文数据以及所述词汇表,利用完形填空任务训练得到古文预训练模型,完成对基于深度学习的古文预训练系统的训练。
3.根据权利要求1所述的基于深度学习的古文预训练系统的训练方法,其特征在于,所述步骤S1包括以下步骤:
S101、获取预训练的古文数据;
S102、删除所述古文数据中的特殊符号,并将繁体中文转换成简体中文;
S103、删除古文数据中的标题,完成对所述古文数据的预处理。
4.根据权利要求1所述的基于深度学习的古文预训练系统的训练方法,其特征在于,所述步骤S2中古文预训练模型的结构包括依次连接的输入层、12个结构相同的Transformer层以及输出层;每个所述Transformer层均包括依次连接的多头注意力层、第一残差和正则化层、前馈网络层以及第二残差和正则化层,其中,
第一个Transformer层的多头注意力层与输入层连接,第十二个Transformer层的第二残差和正则化层与输出层连接,两个相邻Transformer层之间通过第二残差和正则化层以及多头注意力层连接。
5.根据权利要求4所述的基于深度学习的古文预训练系统的训练方法,其特征在于,各所述Transformer层中多头注意力层、第一残差和正则化层、前馈网络层以及第二残差和正则化层的隐藏层节点数均为768个;各所述多头注意力层的注意力头数量均为12个;各所述前馈网络层的节点数均为3072个。
6.根据权利要求4所述的基于深度学习的古文预训练系统的训练方法,其特征在于,所述输入层包括词嵌入向量层和位置向量层,所述词嵌入向量层的节点数为21128个,所述位置向量层的节点数为512个。
7.根据权利要求4所述的基于深度学习的古文预训练系统的训练方法,其特征在于,所述步骤S3包括以下步骤:
S301、根据预处理后的古文数据,随机选择15%的古文文字得到第一文本序列;
S302、分别将第一文本序列中80%的古文文字利用MASK符号进行遮盖处理、将10%的古文文字利用词汇表中的文字进行替换以及保持10%的古文文字不变,得到第二文本序列;
S303、利用包括第一文本序列和第二文本序列的所有预处理后的古文数据训练古文预训练模型,完成对基于深度学习的古文预训练系统的训练。
8.根据权利要求7所述的基于深度学习的古文预训练系统的训练方法,其特征在于,所述步骤S303中古文预训练模型的目标函数的表达式如下:
L(θ;X)=∑x∈Xlog(xmask|x\mask;θ)
X={x1,x2,...,xn}
其中,L(θ;X)表示古文预训练模型的目标函数,X表示所有的古文文本训练数据,xn表示第n个文本序列,θ表示古文预训练模型参数,xmask表示在X中被遮掩处理的15%的古文数据,x\mask表示在X中除第一文本序列剩余的85%的古文数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011094231.5/1.html,转载请声明来源钻瓜专利网。