[发明专利]用于识别图像中的表格内的字符的方法和装置有效
申请号: | 201810105147.5 | 申请日: | 2018-02-02 |
公开(公告)号: | CN110135217B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 徐作新;方胜 | 申请(专利权)人: | 兴业数字金融服务(上海)股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T3/60;G06T5/00;G06T7/60 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;姚杰 |
地址: | 200127 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 图像 中的 表格 字符 方法 装置 | ||
1.一种用于识别图像中的表格内的字符的方法,所述方法包括:
识别所述图像中的一组内容点,所述内容点表示与所述表格的边或所述字符相关联的像素点;
基于所述一组内容点与所述图像中的一组预定义直线之间的位置关系,确定所述表格的所述边相对于所述图像的边线的斜率;
基于所述斜率来将所述表格调整为与所述边线平行;以及
获取经调整的所述表格内的字符。
2.根据权利要求1所述的方法,其中识别所述图像中的所述一组内容点包括:
将所述图像中的像素点的像素值进行排序;
基于排序的像素点中的一部分像素点的像素值确定阈值像素值;以及
针对所述图像中的特定像素点,响应于所述特定像素点的像素值低于所述阈值像素值,将所述特定像素点标识为内容点。
3.根据权利要求2所述的方法,其中基于排序的像素点中的一部分像素点的像素值确定阈值像素值包括:
在排序的像素点中选择一组像素点;以及
基于选择的所述一组像素点的像素值的平均值确定所述阈值像素值。
4.根据权利要求1所述的方法,其中确定所述斜率包括:
统计与所述一组预定义直线中的预定义直线之间的距离满足预定条件的所述图像中的像素点的数量;以及
基于所述一组预定义直线中的与最大数量相关联的预定义直线的斜率,确定所述斜率。
5.根据权利要求4所述的方法,进一步包括获取所述一组预定义直线,包括:
获取不高于所述图像的阈值斜率的一组斜率,所述阈值斜率是基于所述图像的高度和宽度比而确定的;
获取不高于所述图像的高度的一组偏移值;以及
基于所述一组斜率和所述一组偏移值定义所述一组预定义直线。
6.根据权利要求1所述的方法,其中基于所述斜率来将所述表格调整为与所述边线平行包括:
基于所述斜率确定所述表格的所述边相对于所述图像的所述边线的倾斜角度;以及
基于所述倾斜角度对图像进行旋转。
7.根据权利要求1所述的方法,其中获取经调整的所述表格内的所述字符包括:
在经调整的所述图像内,分别确定所述表格的水平表格线和垂直表格线;
基于确定的所述水平表格线和垂直表格线来确定所述表格的表格单元;以及
识别所述表格单元内的字符。
8.根据权利要求7所述的方法,其中确定所述水平表格线包括:
获取经调整的所述图像内的像素点在水平方向上的累积像素值;以及
基于所述累积像素值确定所述水平表格线。
9.根据权利要求7所述的方法,其中确定所述垂直表格线包括:
获取经调整的所述图像内的像素点在垂直方向上的累积像素值;以及
基于所述累积像素值确定所述垂直表格线。
10.一种用于识别图像中的表格内的字符的装置,所述装置包括:
识别模块,所述识别模块被配置为识别所述图像中的一组内容点,所述内容点表示与所述表格的边或所述字符相关联的像素点;
斜率确定模块,所述斜率确定模块被配置为基于所述一组内容点与所述图像中的一组预定义直线之间的位置关系,确定所述表格的所述边相对于所述图像的边线的斜率;
调整模块,所述调整模块被配置为基于所述斜率来将所述表格调整为与所述边线平行;以及
获取模块,所述获取模块被配置为获取经调整的所述表格内的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兴业数字金融服务(上海)股份有限公司,未经兴业数字金融服务(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810105147.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序