[发明专利]电子设备及其文本录入的方法无效
申请号: | 200710030634.1 | 申请日: | 2007-09-29 |
公开(公告)号: | CN101140617A | 公开(公告)日: | 2008-03-12 |
发明(设计)人: | 董磊;徐波;邱光益 | 申请(专利权)人: | 东莞市步步高教育电子产品有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 广州三环专利代理有限公司 | 代理人: | 郝传鑫 |
地址: | 523860广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子设备 及其 文本 录入 方法 | ||
技术领域
本发明涉及电子产品领域,尤其涉及一种电子设备及其文本录入的方法。
背景技术
目前电子设备的文本录入方式,一般是通过键盘或手写笔等人工方式实现,如:当电子词典用户在阅读书面文本遇到需要查询的单词时,需要通过键盘或者手写笔将单词逐个输入到电子词典,才能达到查询目的。这种键盘或手写笔等方式录入文字或文本相当繁琐、麻烦,同时,过度的使用键盘或手写笔,很容易导致键盘或手写笔及输入屏的损坏,从而降低了电子词典的寿命。另外,键盘输入范围较窄,仅可通过特定的方法用特定的操作才能输入,比如阿拉伯语对于外国人就难以完成正确输入,因为阿拉伯语,它的字符存在四种变换方式,键盘上是基本形态,但当输入后它会随前一个字符而变换形态,形成连成一片的文字,对于我们非阿拉伯人来说,照着样本都不知道怎么输入。另一种录入方式是通过语音录入,但这种方式并不成熟,易受环境背景噪声的干扰,同时,还会受方言、语调、语速及词汇量的影响,目前无法在电子产品中使用。
发明内容
本发明实施例的目的在于提供一种电子设备及其文本录入的方法,可通过摄像录入的方式,将待录入文本输入电子设备并转化为文本格式,以备用户使用。
一方面,本发明实施例提出了一种电子设备文本录入的方法,其包括:
通过录像采集待录入的文本图像;
将采集得到的连续文本图像序列组合成静态文本图像;
利用对比识别算法将所述静态文本图像转化成文本格式,所述对比识别算法包括:欧氏空间的对比方法、松弛比对法、动态程序比对法、类神经网络的数据库建立及比对、隐马尔可夫模型(Hidden Markov Model,HMM)及专家系统法。
其中,所述利用对比识别算法将所述静态文本图像转换成文本格式的步骤
具体包括:
对所述静态文本图像进行影像处理,所述影像处理包括:图像正规化处理、噪声去除处理、影像矫正处理。
对经过所述影像处理后的静态文本图像进行版面分析及识别处理;
将经过所述版面分析及识别处理后的静态文本图像切割成单个字符图像并提取所述单个字符图像的文字特征(如:统计特征和结构特征);
利用对比识别算法根据所述单个字符图像的文字特征,将所述单个字符图像转化成文本格式
优选地,所述版面分析具体包括:
对所述静态文本图像进行总体分析,区分出文本段落、排版顺序以及图像和表格的区域;
对需要识别的区域进行定位和标识。
优选地,将经过所述版面分析及识别处理后的静态文本图像切割成单个字符图像具体为:
通过页面切分将所述静态文本图像的页面切分成一个一个的文字段落;
通过行行切分将所述文字段落切分成一个一个的图像行;
从所述图像行中分离出单个字符图像,并擦除图像块,保留文字块。
另一方面,本发明实施例提出了一种电子设备,包括:
图像采集模块,用于通过录像采集待录入的文本图像;
数据库模块,至少存储有欲识别的字集文字的特征数据库;
中央处理模块,根据数据库模块存储的特征数据库,利用对比识别算法将图像采集模块采集到的文本图像转化成文本格式。
其中,所述图像采集模块包括:
图像输入单元,用于通过录像的方式将待输入的文本转换成文本图像;
图像处理单元,用于将图像输入单元连续录入的文本图像形成图像序列。
其中,所述中央处理单元包括:
静态图像生成单元,用于将所述图像采集模块采集到的文本图像序列组合成静态文本图像;
格式转化单元,利用对比识别算法将所述静态文本图像转化成文本格式。
较佳地,所述中央处理单元还可以包括一缓存单元,用于保存图像采集模块采集的文本图像序列,供静态图像生成单元处理。
优选地,所述格式转化单元包括:
图像预处理单元,用于对静态图像生成单元组合得到的静态文本图像进行影像处理(如:图像正规化处理、噪声去除处理、影像矫正处理等);
图像定位单元,用于对经图像预处理单元处理后的静态文本图像进行版面分析及识别处理;
图像切分单元,用于将经图像定位单元处理后的静态文本图像切割成单个字符图像;
对比识别单元,利用对比识别算法将图像切分单元切割得到的单个字符图像转化成文本格式。
优选地,所述格式转化单元进一步包括一字词后处理单元,用于对所述对比识别单元转化得到的文本文字进行校正处理。
其中,所述对比识别单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市步步高教育电子产品有限公司,未经东莞市步步高教育电子产品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710030634.1/2.html,转载请声明来源钻瓜专利网。