[发明专利]基于频谱分析和SVM的文字定位的非文本滤除方法在审
申请号: | 201811281682.2 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109284751A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 霍华;桂洋;吕靖;杜琰 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 陈佳丽 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 初步定位 非文本 滤除 灰度投影 频谱分析 频谱图 快速傅里叶变换 边缘分类 候选边缘 文件构建 一维数组 二值化 频率域 数据集 准确率 竖直 存储 转换 图片 分析 | ||
1.基于频谱分析和SVM的文字定位的非文本滤除方法,其特征在于:包括以下步骤:
步骤1、对需要进行文字定位的图片存入文件构建数据集用;
步骤2、使用候选边缘重组和边缘分类的方法对步骤1存储的图片进行初步定位,得到初步定位区域;
步骤3、将初步定位区域二值化,并在竖直方向上灰度投影;
步骤4、通过快速傅里叶变换将步骤3灰度投影后得到的一维数组转换到频率域得到初步定位区域的频谱图,对频谱图的特点进行分析;
步骤5、使用SVM分类器对初步定位区域进行非文本滤除;
步骤6、计算定位准确率。
2.根据权利要求1所述的基于频谱分析和SVM的文字定位的非文本滤除方法,其特征在于:所述步骤3中对初步定位区域二值化并在数值方向上进行灰度投影的具体步骤为:
步骤3.1、将步骤2得到的初步定位区域图像转换成便于图像处理的灰度图像;
步骤3.2、对步骤3.1得到的灰度图像进行噪音滤除;
步骤3.3、对步骤3.2处理过的灰度图像进行分析处理得到其全局阈值T,然后将灰度图像中灰度值小于T的像素点经阈值处理后该点的值设为1,反之经阈值处理后该点的值设为0;
步骤3.4、将步骤3.3处理后得到的二值化图像作垂直方向的投影,累加各列上的黑色像素点得到其个数。
3.根据权利要求1所述的基于频谱分析和SVM的文字定位的非文本滤除方法,其特征在于:所述步骤4中通过快速傅里叶变换将其转换到频率域,对频谱图的特点进行分析的具体方法为:
步骤4.1、将竖直方向上灰度投影后得到的一维数组进行快速傅里叶变换,使成行的周期信号转换到频率域得到初步定位区域的频谱图;
步骤4.2、通过以上步骤得到全部初步定位区域的频谱图,其中包括文本区域的频谱图和非文本区域频谱图;
步骤4.3、将频谱图和对应的初步定位区域标上序号,对大量的频谱图进行分析并总结出最能代表非文本和文本差异的频谱特征值。
4.根据权利要求1所述的基于频谱分析和SVM的文字定位的非文本滤除方法,其特征在于:所述步骤5中使用SVM分类器对初步定位区域进行非文本滤除的具体方法为:
步骤5.1、选定SVM分类器作为训练手段;
步骤5.2、选择频率2到频率n内频率所对应的幅值和频率12到频率31之间的幅值峰值作为输入特征值输入;
步骤5.3、设定SVM的输出为2个一维数组;
步骤5.4、通过实验确定输出结果的函数关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811281682.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:票据识别方法及装置、电子设备及存储介质
- 下一篇:一种车辆的快速检测方法