[发明专利]文字摘录装置、方法和系统无效
申请号: | 201010133231.1 | 申请日: | 2010-03-25 |
公开(公告)号: | CN102201051A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 刘昌平;梁义海 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 摘录 装置 方法 系统 | ||
技术领域
本发明属于信息设备处理领域,涉及一种摘录文本文字的装置,尤其涉及一种通过自动聚焦形成文字图像进行处理识别进而获得可编辑文字的文字摘录装置、方法和系统。
背景技术
随着信息技术的快速发展,文字的计算机数据储存方式在文字流通环节占据重要一环,文字转换成可编辑处理的计算机数据是信息社会的一个重要工作。将作为载体的纸张上记载的文字转换为计算机数据,除了通过计算机键盘输入和轨迹输入文字生成计算机数据进行存储外,还可通过光学字符识别方法将纸张上的文字转换成计算机数据。其具体原理是:使用扫描仪扫描纸张上的文字获得图像,或使用具有拍摄功能的设备,比如手机、照相机、掌上电脑等手持设备对文本进行整体或者局部成像,生成文字图像,再应用光学字符识别技术进行识别转化为计算机数据。
但在上述以扫描获得文字图像的方式中,由于扫描仪体积庞大,不能随身携带,无法实现随时随地进行文本信息的摘抄和录入,而且也不能进行有选择性地扫描文本片段或单句。而对于拍摄获得文字图像的方式,具有拍摄功能的手持设备主要是采用手动对焦拍摄文本获得图像,此种方式存在三个缺陷:首先是对焦困难,文本区域的清晰成像需要调整镜头的位置直至最佳时保持静止不动;其次是需要手动按键拍摄获得对焦清晰的图像,在按按键的过程中,手会有轻微的抖动,而且很多具有拍摄功能的手持设备其拍照模式的参数和预览模式的参数存在差异,这样手动拍摄的图像和手动对焦清晰的图像常常会不一致,也就是说,手动拍照会造成图像不清晰;最后,由于拍摄范围、拍摄高度和拍摄时机很难控制,从而图像不清晰和图像分辨率不够,造成图像质量往往达不到光学字符识别软件处理的要求,这样就导致文字识别率不高。因此,这种通过手持设备拍摄文字进行识别的方法存在对焦难、拍摄难、识别难等问题。
发明内容
本发明所要解决的技术问题是,提供一种文字摘录装置、方法和系统,通过设置图像传感器和短焦镜头自动对焦、拍摄文字方式获得清晰图像进行识别,克服了现有技术中对焦难、拍摄难、识别难的问题。
本发明为解决上述技术问题所要采取的技术方案是提供一种文字摘录装置,包括壳体,设置在壳体内部的处理器,设置在壳体表面的显示屏,设置在壳体内部与所述处理器相连的对被摘录文本上的文字聚焦成像的图像传感器,安装在所述图像传感器上用于使被摘录文本上的文字在图像传感器上得到放大成像的短焦镜头,所述图像传感器将获得的文字图像发送至处理器处理,并将所述文字图像同步显示在显示屏上,所述处理器对文字图像进行识别处理后将识别结果显示在显示屏上。
其中,所述短焦镜头的焦距为3mm-15mm。所述图像传感器为CMOS图像传感器。所述显示屏为液晶显示屏或双稳态显示屏,并在显示屏上设定图像显示区域和文字显示区域,所述文字图像显示在显示屏上设定的图像显示区域内,所述文字图像的识别结果显示在显示屏上设定的文字显示区域内。
其中,所述外壳上与图像传感器对应的位置处设置一开孔,使得图像传感器透过开孔获取被摘录文本上的文字图像。
其中,所述短焦镜头与被摘录文本的垂直距离为5cm-10cm。
本发明还提供一种使用文字摘录装置摘录文字的方法,包括如下步骤:
步骤1,采集文字图像,通过文字摘录装置显示屏的预览模式获取被摘录文本上的文字图像;
步骤2,触发文字图像,判断获取的文字图像是否满足设定的识别条件,若文字图像满足设定的识别条件,执行步骤3,若文字图像没有满足设定的识别条件,返回步骤1;
步骤3,提取文字图像,提取文字图像的完整的图像数据;
步骤4,图像处理和识别,根据所提取文字图像的图像数据,进行图像处理和光学字符识别,获得被摘录文本上的文字。
其中,步骤1中,所述获取被摘录文本上的文字图像包括通过文字摘录装置上的图像传感器采集经图像传感器上设置的短焦镜头放大后的文字图像,并将采集的文字图像同步显示在显示屏上设定的图像显示区域内。
其中,步骤2中,所述设定条件至少包括文字分辨率、清晰度和对比度。所述判断文字图像是否满足设定的识别条件时,根据判断结果产生提示信号。
其中,步骤4中,所述图像处理至少包括图像增强、倾斜校正、图像锐化和图像二值化,所述获得被摘录文本上的文字包含将获得的文字显示在显示屏上设定的文字显示区域内。
其中,所述步骤1之前还包括步骤,调整获取被摘录文本上的文字与文字摘录装置之间的文字图像获取距离。
其中,所述文字图像获取距离为5cm-10cm。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010133231.1/2.html,转载请声明来源钻瓜专利网。