[发明专利]银行回单识别方法、系统、设备及存储介质在审
申请号: | 202210331613.8 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114898371A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 吴昆 | 申请(专利权)人: | 迈容智能科技(上海)有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/18;G06V30/413;G06V10/82;G06N3/04;G06N3/08;G06Q40/02 |
代理公司: | 上海诺衣知识产权代理事务所(普通合伙) 31298 | 代理人: | 衣然 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 银行 回单 识别 方法 系统 设备 存储 介质 | ||
1.一种银行回单识别方法,其特征在于,包括:
获取待识别的银行回单图像;
检测出所述银行回单图像的表格区域;
采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;
将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;
对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。
2.根据权利要求1所述的银行回单识别方法,其特征在于,所述检测出所述银行回单图像的表格区域包括:
采用基于U-Net网络的语义分割模型对所述银行回单图像的表格区域进行检测;
采用生成对抗网络对检测出的表格区域的整体形状进行约束。
3.根据权利要求2所述的银行回单识别方法,其特征在于,所述采用基于U-Net网络的语义分割模型对所述银行回单图像的表格区域进行检测包括:
所述银行回单图像被分割为多个联通区域;
所述检测出所述银行回单图像的表格区域还包括:
选取最大联通区域作为候选表格区域;
填充候选表格区域内的联通区域使其作为表格区域的一部分;以及
基于候选表格区域的边界轮廓确定表格区域的四个顶点。
4.根据权利要求3所述的银行回单识别方法,其特征在于,所述基于候选表格区域的边界轮廓确定表格区域的四个顶点包括:
检测出候选区域边界的轮廓;
将所述轮廓的曲线折线化,对图像轮廓点进行多边形拟合;
确定拟合得到的多边形的所有顶点的位置;
以距离所述银行回单图像四个顶点最近的四个点,作为表格区域的四个顶点。
5.根据权利要求1所述的银行回单识别方法,其特征在于,所述采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图包括:
采用投影法对表格区域的图像进行列分割,得到若干包含一行文字的图片;
采用基于长短时记忆网络和条件随机场的序列标注模型对所述若干包含一行文字的图片进行行分割,得到多个被判定为文字区域的子图。
6.根据权利要求1所述的银行回单识别方法,其特征在于,所述对所述待识别的文字区域进行文字识别包括:
通过基于注意力机制的文字识别模型对所述待识别的文字区域进行文字识别。
7.根据权利要求1所述的银行回单识别方法,其特征在于,所述对所述待识别的文字区域进行文字识别还包括:
建立一映射表,所述映射表的键为银行回单中同一目标字段的多种别称字样,值为归类后的字段名;
通过所述映射表将银行回单中同一目标字段的不同别称字样映射为归类后的字段名。
8.一种银行回单识别系统,其特征在于,包括:
获取模块,用以获取待识别的银行回单图像;
第一检测模块,用以检测出所述银行回单图像的表格区域;
第二检测模块,用以采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;
串联模块,用以将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;以及
识别模块,用以对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述银行回单识别方法的步骤。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至7中任一项所述银行回单识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迈容智能科技(上海)有限公司,未经迈容智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210331613.8/1.html,转载请声明来源钻瓜专利网。