[发明专利]文字识别方法和装置有效
申请号: | 201310173147.6 | 申请日: | 2013-05-10 |
公开(公告)号: | CN104143093B | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 缪定凡;金远;黎君 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 装置 | ||
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字识别方法和装置。
背景技术
随着移动终端(例如智能手机、平板电脑等)的快速发展与普及,基于多媒体信息处理的需求越来越大,例如图像OCR(Optical Character Recognition,光学字符识别)识别,首先对图像中的字符块进行提取,之后采用OCR识别将文字图像转换为对应的文本。在早期基于OCR识别的文本划词的研究中,对欧洲语系的文字(主要是拼音字母文字)分块已经有了显著的成果。然而,对于亚洲语言文字(主要是象形文字,例如:汉字、日文)的分块方法,针对欧美语系的划词算法则未能满足需求,主要原因是亚洲语言文字的偏旁构字方式(以中文汉字为典型)与标点符号的混合呈现,往往出现字块分块不准确的问题。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的第一个目的在于提出一种文字识别方法。该方法针对象形文字改进了对断块、字块合并不准确的情况,大大提高了用户体验。
本发明的第二个目的在于提出另一种文字识别方法。
本发明的第三个目的在于提出一种文字识别装置。
本发明的第四个目的在于提出另一种文字识别装置。
为了实现上述目的,本发明第一方面实施例的文字识别方法包括以下步骤:获取当前的文字图像;列切分所述文字图像以获取所述文字图像中的多个字块及对应宽度,并根据所述多个字块及对应宽度获取标准宽度;获取用户在所述文字图像上划取的字块;以及根据所述标准宽度对所述划取字块进行合并,并对合并后的所述划取字块进行识别以获取对应的划取字符。
根据本发明实施例的文字识别方法,列切分当前的文字图像以获取当前的文字图像中的多个字块及对应宽度,并根据多个字块及对应宽度获取标准宽度,进一步根据标准宽度对划取字块进行动态合并以获取对应的划取字符,针对象形文字改进了对断块、字块合并不准确的情况,大大提高了用户体验。
为了实现上述目的,本发明第二方面实施例的文字识别方法包括以下步骤:获取当前的文字图像;获取用户在所述文字图像上划取的字块;获取所述划取字块所在的文字行;列切分所述文字行以获取所述文字行中的多个字块及对应宽度,并根据所述多个字块及对应宽度获取标准宽度;以及根据所述标准宽度对所述划取字块进行合并,并对合并后的所述划取字块进行识别以获取对应的划取字符。
根据本发明实施例的文字识别方法,列切分当前的文字行以获取当前的文字行中的多个字块及对应宽度,并根据多个字块及对应宽度获取标准宽度,进一步根据标准宽度对划取字块进行动态合并以获取对应的划取字符,针对象形文字改进了对断块、字块合并不准确的情况,大大提高了用户体验。
为了实现上述目的,本发明第三方面实施例的文字识别装置,包括:第一获取模块,用于获取当前的文字图像;切分模块,用于列切分所述文字图像以获取所述文字图像中的多个字块及对应宽度;第二获取模块,用于根据所述多个字块及对应宽度获取标准宽度;第三获取模块,用于获取用户在所述文字图像上划取的字块;以及合并模块,用于根据所述标准宽度对所述划取字块进行合并,并对合并后的所述划取字块进行识别以获取对应的划取字符。
根据本发明实施例的文字识别装置,切分模块列切分当前的文字图像以获取当前的文字图像中的多个字块及对应宽度,并通过第二获取模块根据多个字块及对应宽度获取标准宽度,进一步通过合并模块根据标准宽度对划取字块进行动态合并以获取对应的划取字符,针对象形文字改进了对断块、字块合并不准确的情况,大大提高了用户体验。
为了实现上述目的,本发明第四方面实施例的文字识别装置,包括:第一获取模块,用于获取当前的文字图像;第二获取模块,用于获取用户在所述文字图像上划取的字块;第三获取模块,用于获取所述划取字块所在的文字行;列切分模块,用于列切分所述文字行以获取所述文字行中的多个字块及对应宽度;第四获取模块,用于根据所述多个字块及对应宽度获取标准宽度;以及合并模块,用于根据所述标准宽度对所述划取字块进行合并,并对合并后的所述划取字块进行识别以获取对应的划取字符。
根据本发明实施例的文字识别装置,切分模块列切分当前的文字行以获取当前的文字行中的多个字块及对应宽度,并通过第四获取模块根据多个字块及对应宽度获取标准宽度,进一步通过合并模块根据标准宽度对划取字块进行动态合并以获取对应的划取字符,针对象形文字改进了对断块、字块合并不准确的情况,大大提高了用户体验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310173147.6/2.html,转载请声明来源钻瓜专利网。