[发明专利]一种智能化印章识别方法在审
申请号: | 202110629876.2 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113554021A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 吴乐琴;覃勋辉;刘科;申发海 | 申请(专利权)人: | 傲雄在线(重庆)科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆弘旭专利代理有限责任公司 50209 | 代理人: | 周韶红 |
地址: | 401329 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能化 印章 识别 方法 | ||
1.一种智能化印章识别方法,其特征在于:
包括:印章区域定位过程、印章图像预处理、模型预训练过程以及印章文本生成过程;
所述印章区域定位过程具体为获取待识别的印章图像,自动定位印章区域的位置;
所述印章图像预处理包括两次预处理,通过对印章图像进行第一次预处理,获得清晰、准确的印章图像;然后通过对印章图像进行第二次预处理,使其满足骨干网络的输入格式;
所述模型预训练过程为多模态网络训练,包括印章图像模型训练、印章文本模型训练以及训练模型匹配程度判断;具体为:
a、印章图像模型训练:采用骨干网络对预处理后的印章图像进行图片特征的提取,然后通过全连接层对提取的图片特征维度进行重映射,再对重映射后的向量个数进行随机重采样;
b、印章文本模型训练:
b1、mask predict训练:随机选取印章图像的印章文本20%~30%作为网络预测对象,对文本侧采用mask predict的方式进行训练;
b2、shift predict训练:
b21、采用seq-to-seq LM的模式、即左侧字符对右侧字符和网络信息不可见,从而对步骤b1中训练后的文本进行训练;
b22、在步骤b21训练过程中,同时在模型的输入过程加入少许噪声,从而确保训练过程中识别更多的字符;
b3、uniLM训练:进行步骤b1与步骤b2的往复循环训练,直至完成最终的文本侧训练;
c、训练模型匹配程度判断:
模型融合:采用BERT多模态模型融合步骤a中印章图像模型训练后的图片特征以及步骤b中印章文本模型训练的文本特征,设定分类函数loss,loss值误差反向传播,更新权重参数,不断迭代训练分类网络,直至误差收敛、loss值不再下降,完成学习;
所述印章文本生成过程具体为:将步骤b中编码后的图片特征输入到BERT多模态模型编码器,BERT多模态模型解码器逐步输出识别的字符直到结束符号。
2.根据权利要求1所述的一种智能化印章识别方法,其特征在于:所述自动定位印章区域的步骤具体为:采用图像处理方法保证图片中的印章区域为整个印章的完整区域、且印章区域面积在图像面积的占比大于25%。
3.根据权利要求1或2任一项所述的一种智能化印章识别方法,其特征在于:所述第一次预处理为采用目标检测、裁剪、图像分割的方式,将图片边界定位到印章图像的边界,同时进行去噪处理;所述裁剪采用局部二值化处理的方法。
4.根据权利要求1~3任一项所述的一种智能化印章识别方法,其特征在于:所述第二次预处理采用缩放、填充的操作;所述缩放具体为将所有图像等长宽比例调整(resize)到同样的尺寸,多余的面积采用黑色进行填充。
5.根据权利要求1所述的一种智能化印章识别方法,其特征在于:所述骨干网络采用ResNet或VGG网络模型中的任一种。
6.根据权利要求1所述的一种智能化印章识别方法,其特征在于:所述分类函数loss采用二分类交叉熵损失函数,其具体步骤为:所述BERT模型输出2*1的向量,分别代表匹配与不匹配的置信度;采用softmax层将置信度归一化到0~1的范围内、并让置信度总和为1,输出归一化后匹配与不匹配的置信度;最后将置信度采用二分类交叉熵损失函数来表示模型的损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于傲雄在线(重庆)科技有限公司,未经傲雄在线(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110629876.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于层次化语义先验的语义分割方法
- 下一篇:一种电工用快速自动夹持钳