[发明专利]基于OCR的无线扫描输入装置和方法有效
申请号: | 200810239537.8 | 申请日: | 2008-12-12 |
公开(公告)号: | CN101751121A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 朱军民 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/20;H04B5/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 无线 扫描 输入 装置 方法 | ||
1.一种基于OCR的无线扫描输入装置,包括扫描装置和主机,所述扫描装置用于对图像进行扫描采集和处理并将图像数据发送给所述主机,其特征是:所述扫描装置和所述主机之间通过无线通信装置连接,
所述无线通信装置包括:
无线发送装置,将经过采集和处理的所述扫描装置输出的压缩二值化图像数据或指令发送出去;
无线接收装置,接收所述无线发送装置发送来的所述压缩二值化图像数据或指令;
所述主机包括:
图像拼接装置,接收所述无线接收装置发送来的所述压缩二值化图像数据并进行解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接,在一边图像传输的同时,一边进行帧图像的拼接工作,当扫描装置发送图像采集终止,则完成了所有的图像帧的拼接工作,得到一幅完整的二值化图像;
文字行提取装置,通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像;
OCR识别装置,包括OCR引擎,将所述完整的二值化图像转换为可编辑字符流。
2.如权利要求1所述的装置,其特征是:所述扫描装置和所述主机之间通过蓝牙装置连接,所述无线通信装置为蓝牙装置,其中所述无线发送装置是蓝牙发送装置,所述无线接收装置是蓝牙接收装置。
3.如权利要求1或2所述的装置,其特征是所述扫描装置包括:
图像采集装置,包括面阵图像传感器、以及光学系统,通过预定时间间隔对所述图像进行采集获得一系列二维帧图像;
图像处理装置,对于所述图像采集装置送入的每帧二维图像进行滤波去噪、图像二值化、编码压缩,以形成压缩二值化图像数据并传输给所述无线发送装置。
4.如权利要求1所述的装置,其特征是:所述OCR识别装置还包括输出装置,将所述可编辑字符流输出到用户指定位置。
5.如权利要求3所述的装置,其特征是:所述面阵图像传感器为OV6130 COMS传感器,所述预定时间间隔为1/60秒。
6.如权利要求3所述的装置,其特征是:所述滤波采用3x3的均值滤波,所述图像二值化采用分块的OTSU,所述二值化图像的编码采用游程编码或JBIG-2编码。
7.如权利要求1所述的装置,其特征是:所述无线发送装置设置于所述扫描装置内;所述无线接收装置设置于所述主机内。
8.如权利要求4所述的装置,其特征是:所述输出装置的用户指定位置是光标所在位置、用户指定的文件或手机短信。
9.一种基于OCR的无线扫描输入方法,采用如权利要求1至8任何一项所述的装置,其特征是:所述方法包括以下步骤:
步骤(a)、所述扫描装置对图像进行扫描采集和处理;
步骤(b)、通过无线发送方式将图像数据发送给所述主机,
步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像数据;
步骤(d)、接收所述无线接收装置发送来的所述压缩二值化图像数据并进行解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接,在一边图像传输的同时,一边进行帧图像的拼接工作,当扫描装置发送图像采集终止,则完成了所有的图像帧的拼接工作,得到一幅完整的二值化图像;
步骤(e)、通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像;
步骤(f)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810239537.8/1.html,转载请声明来源钻瓜专利网。