[发明专利]一种文本格式审核方法、模型及存储介质在审
申请号: | 202111665454.7 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114282492A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 陆舟 | 申请(专利权)人: | 飞天诚信科技股份有限公司 |
主分类号: | G06F40/103 | 分类号: | G06F40/103;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 格式 审核 方法 模型 存储 介质 | ||
1.一种文本格式审核方法,其特征在于,包括如下步骤:
步骤1、设置文本格式审核模型的超参数,根据设置的超参数初始化文本格式审核模型,向所述文本格式审核模型中导入训练文本;
步骤2、判断所述训练文本的训练格式,如为悬置段格式,则执行步骤2-1;如为图例格式,则执行步骤2-2;如为正文字题格式,则执行步骤2-3;如为数字列项格式,则执行步骤2-4;
步骤2-1:设置所述训练文本的悬置段格式特征列表,根据所述训练文本的悬置段格式特征列表构建所述训练文本段落的格式向量,得到所述训练文本段落的张量类型数据,将所述训练文本段落的张量类型数据作为所述文本格式审核模型的输入数据,执行步骤3;
步骤2-2:设置所述训练文本的图例格式特征列表,根据所述训练文本的图例格式特征列表构建所述训练文本段落的格式向量,得到所述训练文本段落的张量类型数据,将所述训练文本段落的张量类型数据作为所述文本格式审核模型的输入数据,执行步骤8;
步骤2-3:设置所述训练文本的正文字体格式特征列表,根据所述训练文本的正文字体格式特征列表构建所述训练文本段落的格式向量,得到所述训练文本段落的张量类型数据,将所述训练文本段落的张量类型数据作为所述文本格式审核模型的输入数据,执行步骤8;
步骤2-4:设置所述训练文本的数字列项格式特征列表,根据所述训练文本的数字列项格式特征列表构建所述训练文本段落的格式向量,得到所述训练文本段落的张量类型数据,将所述训练文本段落的张量类型数据作为所述文本格式审核模型的输入数据,执行步骤3;
步骤3、调取所述超参数中的数据参数,对所述训练文本段落的张量类型数据进行卷积计算,得到训练文本段落的卷积数据;
步骤4、调取所述超参数中的函数,对所述训练文本段落的卷积数据进行激励计算,得到所述训练文本段落激励数据;
步骤5、对所述训练文本段落激励数据进行池化操作,得到池化操作结果;
步骤6、判断是否存在待操作的卷积层,若存在,则将所述池化操作结果作为所述训练文本的张量类型数据,返回步骤3;若不存在,则执行步骤7;
步骤7、根据所述池化操作结果更新所述训练文本段落的张量类型数据;
步骤8、利用所述训练文本段落的张量类型数据对所述审核模型中全连接层各层节点的权重和偏置进行逐层计算,根据对最后一层各节点的权重和偏置进行计算的结果构建所述训练文本段落的终层张量类型数据;
步骤9、计算所述训练文本段落的终层张量类型数据和标签的交叉熵;
步骤10、利用所述交叉熵计算损失率,将所述损失率与所述超参数进行比对,判断所述审核模型是否构建成功,若成功,则执行步骤12,否则执行步骤11;
步骤11、通过反向传播算法计算所述全连接层的各层节点的调整向量,根据所述调整向量对所述全连接层的各层节点的权重和偏置进行调整,返回步骤3;
步骤12、将待检测文本输入至构建成功的文本格式审核模型,基于所述文本格式审核模型输出所述待检测文本审核结果张量类型数据,根据所述审核结果张量类型数据判断所述待检测文本是否通过格式审核并对未通过格式审核的待检测文本进行格式错误批注。
2.如权利要求1所述的方法,其特征在所,所述超参数具体包括:由决定所述审核模型中损失函数变化速度的学习率,卷积核的维度、步长、填充策略、预设值、数量,由卷积核的构造参数构建的卷积层的数量,所述审核模型每层节点的数量,节点的权重和偏置以及预设值。
3.如权利要求2所述的方法,其特征在于,所述调取所述超参数中的数据参数,对所述训练文本段落的张量类型数据进行卷积计算,得到训练文本段落的卷积数据,具体为:调取所述超参数中卷积核的构造参数,根据所述卷积核的构造参数构造卷积核,用所述卷积核对所述训练文本段落的张量类型数据进行卷积计算,得到训练文本段落的卷积数据。
4.如权利要求3所述的方法,其特征在于,调取所述超参数中的函数,对所述训练文本段落的卷积数据进行激励计算,得到所述训练文本激励数据,具体为:调取所述超参数中的ReLU激励函数,对所述训练文本段落的卷积数据进行激励计算,得到所述训练文本段落的激励数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞天诚信科技股份有限公司,未经飞天诚信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111665454.7/1.html,转载请声明来源钻瓜专利网。