[发明专利]图片文字识别方法在审

申请号：	201611166407.7	申请日：	2016-12-16
公开（公告）号：	CN106778727A	公开（公告）日：	2017-05-31
发明（设计）人：	刘洋	申请（专利权）人：	高格（天津）信息科技发展有限公司
主分类号：	G06K9/20	分类号：	G06K9/20
代理公司：	暂无信息	代理人：	暂无信息
地址：	300384 天津市南开区天津市滨海高新区华***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片文字识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图文软件领域，特别地，是一种图片文字识别方法。

背景技术

对于图片上的文字，在较多情况下需要进行大段地复制使用，因此，必须要首先通过软件方法先将图片形式的文字转换成可编辑文字；在此过程中，目前使用的方法是，采用一套字模库，将图片中截取的每一个图元文字与字模库中的各个字模文字进行对比，并将相似度最高的字模文字以可编辑文字的形式输出，从而使用户获得所需的可编辑文本。

然而，由于各种图片形式的文本通常采用不同的字体，而目前在将图元文字与字模文字相对比时，通常只采用一套字模库，因此，倘若图元文字的字体与字模库中的字体不同时，则文字识别的准确性并不高；若采用多套字模库，则按一套字模库的逐字对比的方式，每个图元文字将需要与多套字模库中的各字模文字相对比，其工作量十分巨大。

发明内容

针对上述问题，本发明的目的在于提供一种图片文字识别方法，该方法可以准确而高效地识别图片中的文字信息。

本发明解决其技术问题所采用的技术方案是：该图片文字识别方法如下：将用户框选的图片上的文本区域以当前图片形式读取；对框选文本区域中的各个图元文字分别进行选取；将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比，找到相似度最近的字模文字；并记录该相似度最高的字模文字所在的字模库，定义为标准字模库，此后，将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较，在标准字模库中分别找到相似度最高的字模文字，并以可编辑文字的形式输出。

作为优选，所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、行楷、隶书对应的字模库。

作为优选，在分别选取所述框选文本区域中的各个图元文字时，采用矩形框的形式，所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切。

作为优选，在将图元文字与字模文字作对比时，首先将字模文字进行缩放，使之与欲作对比的图元文字大小相同，然后，将缩放好的字模文字转换成字模图元，与所述图元文字作布尔差运算，然后以布尔差之后剩下的文字颜色的多少来衡量相似度，即剩下的文字颜色越少，则相似度越高。

本发明的有益效果在于：在将图元文字与字模文字作对比时，由于采用了多种字模库，因此，使得识别的准确性得到了很大程度的提高，而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中，就可以确定框选文本区域中的第一个图元文字的字体，从而推出该框选文本区域中所有图元文字的字体，这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比，不仅对比工作量小，且不失准确性。

具体实施方式

下面对本发明进一步说明：

本发明提供的图片文字识别方法如下：将用户框选的图片上的文本区域以当前图片形式读取，如，当前图片为允8格式的，那么用户在当前图片上框选部分文本后，将用户框选的文本区域视为一张待处理的允8图片；然后，对待处理的允8图片中的各个图元文字分别进行选取，选取时，采用矩形框的形式，以从上至下、从左到右的顺序逐个选取图元文字，所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切；当选取所述框选文本区域中的第一个图元文字后，将其与各种常规字体对应的字模库中的各个字模文字作对比，找到相似度最近的字模文字，将该字模文字以可编辑文字形式输出，同时，记录该相似度最高的字模文字所在的字模库，定义为标准字模库；此后，将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较，在标准字模库中分别找到相似度最高的字模文字，并以可编辑文字的形式输出。

为了满足绝大部分图元文字的字体需求，所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、行楷、隶书对应的字模库。

另外，在将图元文字与字模文字作对比时，首先将字模文字进行缩放，使之与欲作对比的图元文字大小相同，然后，将缩放好的字模文字转换成字模图元，与所述图元文字作布尔差运算，然后以布尔差之后剩下的文字颜色的多少来衡量相似度，即剩下的文字颜色越少，则相似度越高；如，通常情况下，文字颜色为黑色，则将所述字模图元与图元文字作布尔差运算后，它们相重合部分的黑色被消除了，由背景色替代，那么如果字模图元和图元文字完全一样，则布尔差运算之后，则黑色的剩余量为零，而相似度越低，则黑色的剩余量就越大。

本发明提供的图片文字识别方法在将图元文字与字模文字作对比时，由于采用了多种字模库，因此，使得识别的准确性得到了很大程度的提高，而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中，就可以确定框选文本区域中的第一个图元文字的字体，从而推出该框选文本区域中所有图元文字的字体，这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比，不仅对比工作量小，且不失准确性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于高格（天津）信息科技发展有限公司，未经高格（天津）信息科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201611166407.7/2.html，转载请声明来源钻瓜专利网。

上一篇：板卡定位方法及装置
下一篇：一种移动终端扫描方法、装置及移动终端

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]图片文字识别方法在审

专利文献下载