[发明专利]基于拍摄的图像来识别字符的方法及装置有效
申请号: | 201210539101.7 | 申请日: | 2012-12-13 |
公开(公告)号: | CN103198311B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 金尚镐;姜宇声;权茂植;金桢林;朴正完 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 钱大勇 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 拍摄 图像 识别 字符 方法 装置 | ||
技术领域
本发明一般地涉及用于识别字符的方法和装置,并且更具体地,涉及用于识别在由照相机拍摄的显示屏幕图像中的字符的方法和装置。
背景技术
随着智能手机变得越来越流行,从通过智能手机的照相机拍摄文件、名片等所获得的图像中识别字符的应用的使用也得到增加。在此,在用于识别字符的功能中,光学字符识别功能具有很高的可能性被用作多模态软件输入面板,其向智能手机提供了除了触摸键盘、语音识别等之外的另一种基本输入功能。
识别由移动照相机所拍摄的字符图像的方法向用户提供了经由电子邮件或文本消息来向另一个用户传送识别结果的功能、连接到因特网(Internet)的功能等。具体而言,在通过照相机来对字符进行拍摄而识别出计算机屏幕上显示的字符时,用户可以容易地从计算机将各种字符信息传送到智能手机,并且出于各种目的而使用该信息,从而提高了用户的便利性。
通过使用移动相机来识别在计算机屏幕上字符的方法要求与用于识别书籍、杂志、等的常规方法不同的技术方法。当通过使用高分辨率移动相机来拍摄在计算机屏幕上显示的字符时,照相机图像的分辨率通常大于计算机屏幕的分辨率,这将导致会使得对于每个像素的位置上的字符识别性能劣化的图像噪声。因此,传统的字符识别系统的使用是受限的,并且将计算机屏幕图像锐化的操作和将具有低分辨率的屏幕图像转换为具有高分辨率的图像的操作不适用于一般的基于照相机的字符识别系统。
发明内容
因此,本发明的一个方面是为了解决在现有技术中发生的至少一个上述问题,并且本发明实施例的进一步的目的是提供了用于识别从通过拍摄诸如计算机屏幕、TV屏幕的显示屏幕、以及诸如报纸、书籍、杂志等的文件而获取的拍摄图像中识别字符的方法和装置。
根据本发明的第一方面,提供了一种基于拍摄的图像的字符识别装置,所述装置包括:图像确定单元,被配置用于当输入图像被输入时,从输入图像中选择将用于图像分析的感兴趣的区域(ROI),并且对选定的ROI进行分析,以确定输入图像的类型;图像效果单元,其被配置为如果输入图像的类型指示输入图像是通过拍摄显示屏幕而获得的,则将用于区分显示屏幕中的字符区域和背景区域的图像效果应用到输入图像上;二值化单元,其被配置为根据输入图像的确定的类型对输入图像或图像效果单元的输出进行二值化;以及字符识别单元,其被配置为从二值化的输入图像中识别字符。
根据本发明的第二方面,提供了一种基于拍摄的图像的字符识别方法,所述方法包括:当输入图像被输入时,从输入图像中选择将用于图像分析的感兴趣的区域(ROI);通过分析选定的ROI来确定输入图像的类型;如果输入图像的类型指示输入图像是通过拍摄显示屏幕而获得的,则向输入图像应用用于区分显示屏幕中的字符区域和背景区域的图像效果;根据输入图像的确定的类型对输入图像或具有应用的图像效果的输入图像进行二值化;以及从二值化的输入图像中识别字符。
根据本发明的另一方面,提供了一种包括指令的计算机程序,所述指令被布置为当被执行时实现根据上述各方面的任意一个方面的方法和/或装置。进一步的方法提供存储这样的程序的机器可读存储器。
附图说明
结合附图,从下面的详细描述中,本发明的上述和其他方面、特征、和优点将变得更加明显:
图1是示出了根据本发明的实施例的字符识别装置的视图;
图2是示出在其中,根据本发明的实施例,基于确定结果,字符识别装置确定输入图像的类型和识别字符的处理的流程图;
图3是示出在其中,根据本发明的实施例的图像确定单元确定输入图像的类别的处理的流程图;
图4至10是示出在其中根据本发明的实施例的图像确定单元确定输入图像的类别的处理的视图;
图11是示出了在其中根据本发明的实施例的图像效果单元将效果应用到输入图像的处理的视图;
图12是示出了根据本发明的实施例的结果输出单元输出的字符识别结果的视图;以及
图13是示出了根据本发明实施例的,当通过拍摄文件而获得图像时,通过图像确定单元来确定输入图像的示例的视图。
具体实施方式
在下文中,将参照附图来详细描述本发明的实施例。在下面的描述中,已知功能和配置的详细描述被省略,以避免模糊本发明的主题。
图1示出了根据本发明的实施例的字符识别装置。
字符识别装置包括:照相机单元10、图像确定单元20、图像效果单元30、二值化单元40、字符识别单元50、以及结果输出单元60。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210539101.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序