[发明专利]一种基于表格字符检测与识别的移动端系统与方法在审

专利信息
申请号: 201811367573.2 申请日: 2018-11-16
公开(公告)号: CN109460769A 公开(公告)日: 2019-03-12
发明(设计)人: 谭建豪;刘力铭;王耀南;钟杭;殷旺;余淼;曹章;尚畇凯 申请(专利权)人: 湖南大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京金智普华知识产权代理有限公司 11401 代理人: 杨采良
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 字符检测 卷积神经网络 移动端系统 扫描应用程序 数据处理技术 调整图像 发明集成 分类标准 复杂背景 汉字识别 几何方向 倾斜校正 数据增强 图像分割 移动设备 自动建立 字符识别 字体粗细 表格线 二值化 傅里叶 构建 频谱 校正 样本 核对 采集 腐蚀 膨胀 分割
【权利要求书】:

1.一种基于表格字符检测与识别的移动端图像处理方法,其特征在于,所述基于表格字符检测与识别的移动端图像处理方法包括:

根据图像中物体的几何方向与所述图像对应的傅里叶频谱的关系,对采集的图像进行倾斜校正,获取校正后的图像;

通过OTSU大津法进行二值化,再分别定义横长条和竖长条的核对图像进行腐蚀、膨胀操作获取表格线,对图像进行分割获取字符;

构建用于字母与汉字识别的卷积神经网络,通过随机调整图像亮度、对比度与字体粗细扩充样本实现数据增强,自动建立分类标准,并输出分类标准结果。

2.如权利要求1所述的基于表格字符检测与识别的移动端图像处理方法,其特征在于,所述基于表格字符检测与识别的移动端图像处理方法具体包括:

步骤1:下载中文手写数据集CASIA-HWDB和字母手写数据集Chars74K,通过随机调整图像亮度、对比度、字体粗细扩充样本,搭建由三层卷积层、三层池化层和两层全连接层构成的卷积神经网络,分别对两个数据集离线训练,得到分别识别手写汉字和手写字母的两个卷积模型;

步骤2:应用程序调用手机相机接口获取外界图像,对图像进行离散傅里叶变换得到DFT,通过公式计算幅度图像magnitude,对幅度图像使用对数变换并归一化到[0,255]的范围内,从而得到傅立叶谱,对该傅立叶谱采用霍夫变换检测直线得出该直线的倾斜角度即原图像的倾斜角度,使用所述倾斜角度对原图像进行仿射变换得到倾斜矫正后的图像correct_img;

步骤3:使用OTSU大津法对correct_img进行二值化处理得到二值图像binary_img,首先定义一个横长条的核kernelh对binary_img进行先腐蚀再膨胀的操作得到只有表格横线的图像horizontal_img,然后定义一个竖长条的核kernelv对binary_img进行先腐蚀再膨胀的操作得到只有表格竖线的图像vertical_img,从而得出表格图table_img=horizontal_img+vertical_img,对表格图进行轮廓检测得出轮廓矩形,将轮廓矩形应用于correct_img进行图像的分割获取字符characters=[char1,char2,···,charn];

步骤4:将分割得到的字符characters输入到手写汉字或手写字母的卷积模型中,输出分类结果到界面。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811367573.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top