[发明专利]一种图片文字识别方法在审
申请号: | 201811632008.4 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109753967A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 柯永红;王宁 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/62 |
代理公司: | 北京知迪知识产权代理有限公司 11628 | 代理人: | 李博 |
地址: | 100875 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片文字 准确率 特征区域 字模库 字体 汉字 特征值提取 黑白像素 特征提取 文字识别 组合识别 计算量 相似度 比对 构建 排序 输出 图片 | ||
1.一种图片文字识别方法,其特征在于,包括步骤:
S1、对多种字体中的汉字进行特征值提取,构建字模库;
S2、对待识别的图片上文字进行特征提取,计算特征值;
S3、将计算获得的特征值在字模库进行比对,输出相似度最高的字模汉字。
2.如权利要求1所述的文字识别方法,其特征在于,所述步骤1具体包括:
S101、对一个汉字进行区域划分,将该汉字划分为N个不同的区域,N为大于2的整数;
S102、计算每个区域的特征值,将N个区域的特征值进行存储;
S103、根据字库中所有汉字的多种字体以及多种字号所对应的N区域的特征值构建字模库。
3.如权利要求2所述的文字识别方法,其特征在于,所述步骤1还包括:
S104、根据每个区域的特征值计算单个区域的识别准确率,选取其中的M个作为比较区域,M≤N。
4.如权利要求2所述的文字识别方法,其特征在于,所述步骤101中N为10,区域具体包括汉字的整体、中间部分、上半部分、下半部分、左半部分、右半部分、左上角部分、右上角部分、左下角部分、右下角部分。
5.如权利要求2所述的文字识别方法,其特征在于,所述步骤2具体包括:
S201、以图片形式提取待识别图片中的文字;
S202、对提取到的文字图片进行区域划分,将文字图片划分为不同的区域;
S203、选取与比较区域对应的M个区域;
S204、计算选取的M个区域的特征值。
6.如权利要求5所述的文字识别方法,其特征在于,所述步骤202中进行区域划分时采用矩形框的形式,除中间部分以外,其余区域的所述矩形框的框线至少与图片的最上端、最左端、最下端、最右端其中之一相切。
7.如权利要求5所述的文字识别方法,其特征在于,M为6至8。
8.如权利要求1所述的文字识别方法,其特征在于,所述步骤3中,输出的汉字为可编辑形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811632008.4/1.html,转载请声明来源钻瓜专利网。