[发明专利]基于编解码结构的发票文本识别方法及装置有效
申请号: | 202110249695.7 | 申请日: | 2021-03-08 |
公开(公告)号: | CN113158776B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 刘义江;姜琳琳;李云超;辛锐;陈曦;侯栋梁;魏明磊;杨青;池建昆;范辉;陈蕾;阎鹏飞;吴彦巧;姜敬;檀小亚;师孜晗 | 申请(专利权)人: | 国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V20/62;G06V30/148;G06V10/82;G06N3/04 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 呼春辉 |
地址: | 050022 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 解码 结构 发票 文本 识别 方法 装置 | ||
1.一种基于编解码结构的发票文本识别方法,其特征在于:包括如下步骤,S1发票文本图片预处理,处理器获取发票文本图片,对票文本图片进行预处理并获得预处理图片,预处理包括二值化处理、降噪处理和图像矫正处理;S2文本图片特征提取,处理器将预处理图片处理为统一尺寸的制式图片,处理器将制式图片输入至用于提取特征的第一卷积神经网络,第一卷积神经网络对制式图片进行特征提取并获得三维特征向量矩阵F;在步骤S2中,将预处理图片的长、宽相应调整至160x48个像素点,三维特征向量矩阵F为40*6*512的特征矩阵,包含了制式图片的全部信息,所述第一卷积神经网络包括用于提取特征的第一至第五卷积层、第一至第三最大池化层和第一至第三残差块,用于提取特征的第一卷积层、第二卷积层、第一最大池化层、第一残差块、第三卷积层、第二最大池化层、第二残差块、第四卷积层、第三最大池化层、第三残差块和第五卷积层依次连接,用于提取特征的第一卷积层为3x3卷积核且64输出通道的卷积层,用于提取特征的第二卷积层为3x3卷积核且128输出通道的卷积层,用于提取特征的第三卷积层为3x3卷积核且128输出通道的卷积层,用于提取特征的第四卷积层为3x3卷积核且512输出通道的卷积层,用于提取特征的第五卷积层为3x3卷积核且512输出通道的卷积层,用于提取特征的第一最大池化层为2x2卷积核且2x2步长的池化层,用于提取特征的第二最大池化层为2x2卷积核且2x2步长的池化层,用于提取特征的第三最大池化层为1x2卷积核且1x2步长的池化层,用于提取特征的第一残差块为由两层3x3卷积核且256输出通道的卷积神经网络通过直连分支连接而成的残差块,用于提取特征的第二残差块为由两层3x3卷积核且512输出通道的卷积神经网络通过直连分支连接而成的残差块,用于提取特征的第三残差块为由两层3x3卷积核且512输出通道的卷积神经网络通过直连分支连接而成的残差块;S3卷积神经网络特征编码,处理器将三维特征向量矩阵F输入至用于转换特征向量的第二卷积神经网络,第二卷积神经网络将三维特征向量矩阵F转换为可供门控循环神经网络序列解码输入的待解码特征向量G;在步骤S3中,待解码特征向量G为1*1*512的特征向量,所述第二卷积神经网络包括用于转换特征向量的第一至第三卷积层和第一至第三最大池化层,用于转换特征向量的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层和第三最大池化层依次连接,用于转换特征向量的第一卷积层为3x3卷积核且512输出通道的卷积层,用于转换特征向量的第二卷积层为3x3卷积核且512输出通道的卷积层,用于转换特征向量的第三卷积层为3x3卷积核且512输出通道的卷积层,用于转换特征向量的第一最大池化层为2x2卷积核且2x2步长的池化层,用于转换特征向量的第二最大池化层为2x1卷积核且2x1步长的池化层,用于转换特征向量的第三最大池化层为5x3卷积核且5x3步长的池化层;在S4步骤中,所述门控循环神经网路包含了五十个门控神经网络单元分别是第一至第五十门控神经网络单元,第一门控神经网络单元至第五十门控神经网络单元依次连接;S4门控循环神经网络序列解码,处理器将待解码特征向量G输入至门控循环神经网络,门控循环神经网络解码并获得发票文本图片中对应的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司,未经国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110249695.7/1.html,转载请声明来源钻瓜专利网。