[发明专利]一种基于关键点提取票据图像表格区域的方法及系统在审
申请号: | 202310607075.5 | 申请日: | 2023-05-26 |
公开(公告)号: | CN116631001A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 孙召敏;马杰 | 申请(专利权)人: | 南京市智慧医疗投资运营服务有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/412;G06V10/82;G06V30/146 |
代理公司: | 丽水创智果专利代理事务所(普通合伙) 33278 | 代理人: | 赵晶 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键 提取 票据 图像 表格 区域 方法 系统 | ||
1.一种基于关键点提取票据图像表格区域的方法,其特征在于,包括如下步骤:
S1、通过HTTP协议,获取前端的票据图片并对图像进行预处理;
S2、对图像进行水平矫正;
S3、标注数据,训练深度学习神经网络模型,检测水平正向的图像中票据是否有褶皱;
S4、针对没有褶皱的票据数据,标注数据,训练深度学习神经网络模型,检测票据的4个角点;
S5、利用4个角点,对图片中票据区域进行透视变换,得到矫正后的规则矩形状的票据表格区域;
S6、提取票据表格区域。
2.根据权利要求1所述的一种基于关键点提取票据图像表格区域的方法,其特征在于,在步骤S1中,对图像的预处理包括图像增强和调整分辨率;
其中,所述调整分辨率是将输入图像统一大小,按图像最大长度缩放到1920的比例,对图像进行缩放;
所述图像增强是使用低通滤波,对图像进行全局对比度增强:
res=round((orig-mean)*Factor)+orig
其中,Factor为增加对比度的比例因子;orig为图像的原始灰度值;mean为图像的平均灰度值;round()为四舍五入操作。
3.根据权利要求1所述的一种基于关键点提取票据图像表格区域的方法,其特征在于,在步骤S2中,对图像进行水平矫正的具体步骤包括:
S21、利用ocr检测预训练的神经网络模型,检测图片中的文本;
S22、针对提取的文本,以对角线长度进行排序,选择最长的文本采用透视变换矩阵M1进行水平矫正;
S23、利用文本方向分类模型对透视变换后的文本进行检测,检测水平矫正后的文本方向,如果是正向的,赋值角度Angle为0,如果是倒立的,赋值角度Angle为180;
S24、利用矩阵M1,对图片进行透视变换,使用角度Angle对透视变换后的图片进行旋转,得到水平正向的图片。
4.根据权利要求3所述的一种基于关键点提取票据图像表格区域的方法,其特征在于,在步骤S22中,获取矩阵M1的具体步骤包括:
S221、在ocr检测模型输出结果中,提取最长文本的位置信息,即4个角点坐标[(x1,y1),(x2,y2),(x3,y3),(x4,y4)],以及该文本框的高度h,宽度w;
S222、已知h和w,可以设定最长文本框透视变换后的位置信息为[(0,0),(w,0),(w,h),(0,h)];
S223、根据变换前的位置信息和变换后的位置信息,可以得到3×3的透视变换矩阵M1。
5.一种基于关键点提取票据图像表格区域的系统,用于如权利要求1-5任一项所述的基于关键点提取票据图像表格区域的方法,其特征在于,包括:
图片获取模块,用于通过HTTP协议,获取前端的票据图像;
图像预处理模块,用于票据图像的图像增强和调整分辨率的预处理;
模型训练模块,利用深度学习神经网络,对标注的图像数据进行训练,得到算法模型;
水平矫正模块,对预处理后的图像进行水平矫正;
褶皱检测模块,利用训练的褶皱检测算法模型检测水平正向的图像中票据是否有褶皱;
关键点检测模块,利用训练的关键点检测算法模型检测票据的4个角点;
票据提取模块,用于提取矫正后的规则矩形状的票据区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京市智慧医疗投资运营服务有限公司,未经南京市智慧医疗投资运营服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310607075.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陶瓷金属化设备
- 下一篇:一种多功能天然矿质肥料增效剂及其制备方法