[发明专利]文本图像处理方法、装置、电子设备及计算机可读介质在审
申请号: | 201811486458.7 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109685052A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 丁笑天;刘岩 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;郑特强 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机可读介质 电子设备 文本区域 文本图像 表格线 原始文本图像 目标文本 光学字符识别 图像 光学字符 合并处理 同一单元 整体输出 正确率 检测 算法 文本 中文 | ||
1.一种文本图像处理方法,其特征在于,包括:
对原始文本图像进行文本区域检测,生成多个文本区域块;
对所述原始文本图像进行表格线检测,生成表格线;
基于所述表格线将所述多个文本区域块进行合并处理,生成目标文本图像;以及
通过光学字符识别方法对所述目标文本图像进行文字识别。
2.如权利要求1所述的方法,其特征在于,对原始文本图像进行文本区域检测,生成多个文本区域块包括:
通过区域特征提取算法确定所述原始文本图像中的目标区域;以及
提取带有文本的目标区域以生成所述多个文本区域块。
3.如权利要求2所述的方法,其特征在于,提取带有文本的目标区域以生成所述多个文本区域块包括:
获取目标区域;
通过像素投影方法获取所述目标区域在预定方向上的投影数据;
通过滑动窗口检测法与投影数据确定所述目标区域中带有文本的部分目标区域;以及
通过带有文本的部分目标区域生成所述多个文本区域块。
4.如权利要求3所述的方法,其特征在于,通过滑动窗口检测法与投影数据确定所述目标区域中带有文本的部分目标区域包括:
通过滑动窗口检测法与投影数据获取带有文本的目标区域;以及
通过文本特征方法过滤出所有目标区域中提取带有文本的部分目标区域。
5.如权利要求1所述的方法,其特征在于,对所述原始文本图像进行表格线检测,生成表格线包括:
通过霍夫变换对所述原始文本图像进行表格线检测,生成多个线段;
对所述多个线段进行过滤生成所述表格线,所述表格线包括垂直表格线与水平表格线。
6.如权利要求1所述的方法,其特征在于,基于所述将所述多个文本区域块进行合并处理,生成目标文本图像包括:
提取多个文本区域块中的两个文本区域块;
确定两个文本区域块的位置信息;
根据所述位置信息与所述表格线确定所述两个文本区域块是否满足合并条件;以及
在所述两个文本区域块满足合并条件时,将所述两个文本区域块进行合并,生成行文本图像。
7.如权利要求6所述的方法,其特征在于,基于所述表格线将所述多个文本区域块进行合并处理,生成目标文本图像还包括:
遍历所述多个文本区域块;
将满足合并条件的文本区域块进行合并,生成多个行文本图像;以及
通过所述多个行文本图像生成所述目标文本图像。
8.如权利要求6所述的方法,其特征在于,根据所述位置信息与所述表格线确定所述两个文本区域块是否满足合并条件包括:
在所述两个文本区域块的位置处于相同文本行,且所述两个文本区域块之间不存在表格线时,确定所述两个文本区域块满足合并条件。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811486458.7/1.html,转载请声明来源钻瓜专利网。