[发明专利]字符识别设备和字符识别方法在审
申请号: | 201110271956.1 | 申请日: | 2011-09-09 |
公开(公告)号: | CN102646201A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 织田英人 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;张天舒 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 设备 方法 | ||
技术领域
本发明涉及字符识别设备和字符识别方法。
背景技术
用于将手写字符转换成为文本数据的字符识别技术已经是可利用的。例如,日本未审查专利申请公开No.6-76098描述了这样一种技术,其用于将填充两个相邻字符框的字符和附加到该字符的“dakuten”(或浊音标志)或者“handakuten”(或半浊音标志)转换成为带有浊音标志或半浊音标志的单一的复合字符。日本未审查专利申请公开No.5-12245描述了这样一种技术,其用于确定所输入的手写字符是大写字母还是小写字母。日本未审查专利申请公开No.7-262314描述了这样一种技术,其用于精确地识别“dakuten”(或浊音标志)或者“handakuten”(或半浊音标志)。日本未审查专利申请公开No.9-231316描述了这样一种技术,其用于显示具有相同形状但具有不同大小的字符作为识别候选。
发明内容
因此,本发明的一个目的在于提供精确的字符串识别,即使该字符串包括复合字符。
根据本发明的第一方面,提供了一种字符识别设备,该设备包括获取单元、指定单元、移动单元以及识别单元。获取单元获取表示字符串的数据。指定单元指定满足预定条件的复合字符的元素,所述预定条件用于从字符串确定该复合字符。移动单元将所述复合字符的元素移动靠近相邻字符。识别单元根据字符的形状和相邻字符之间的相关性来识别改变后字符串,其中在改变后字符串中,移动单元已经对该复合字符的元素进行了移动。
根据本发明的第二方面,根据本发明第一方面的字符识别设备还包括存储器,其存储表明跟随在第一字符之后的第二字符出现可能性的值。识别单元通过根据字符的形状指定第二字符的多个候选,并且通过根据存储在存储器中的值从各个候选中选择具有最高出现可能性的字符来识别改变后字符串。
根据本发明的第三方面,在根据本发明第二方面的字符识别设备中还包括整合单元,其对分离的区域进行整合。字符串被写在多个分离的区域中。整合单元对写入了被移动的复合字符的元素的区域和写入了相邻字符的区域进行整合。当要被识别的字符写在没有被整合单元整合的区域中时,识别单元根据该要被识别的字符的形状来指定识别候选作为单一字符,而当要被识别的字符写在被整合单元整合的区域中时,识别单元根据该要被识别的字符的形状来指定识别候选作为单个字符或作为多个字符。
根据本发明的第四方面,在根据本发明的第一至第三任一方面的字符识别设备中,复合字符的元素是变音标志(diacritical mark),并且移动单元将变音标志移动至靠近相邻字符。
根据本发明的第五方面,在根据本发明的第一或第四方面的字符识别设备中,预定条件包括字符的位置和字符笔划数。
根据本发明的第六方面,在根据本发明的第一方面的字符识别设备中,移动单元沿水平方向或者在垂直方向中将复合字符的元素移动至靠近相邻字符。
根据本发明的第七方面,在根据本发明的第一方面的字符识别设备中,获取单元从图像数据获取表示字符串的数据。
根据本发明的第八方面,在根据本发明的第七方面的字符识别设备中,图像数据包括笔迹数据。
根据本发明的第九方面,提供一种字符识别方法,该方法包括:获取表示字符串的数据;指定满足预定条件的复合字符的元素,所述预定条件用于从字符串确定该复合字符;将所述复合字符的元素移动至靠近相邻的字符;以及根据字符的形状和相邻字符之间的相关性识别改变后的字符串,其中在改变后的字符串中,已经对复合字符元素进行了移动。
根据发明的第一方面,即使字符串包括复合字符,与不对字符进行移动而对字符串进行识别的情况相比,可以更精确地对字符串进行识别。
根据发明的第二方面,与不使用存储在存储器中的值来识别字符的情况相比,可以获得更高的字符串识别精度。
根据发明的第三方面,与对被指定作为识别候选的字符的笔划数没有限制的情况相比,可以获得更高的字符串识别精度。
根据发明的第四方面,可以识别具有诸如“dakuten”(或浊音标志)或者“handakuten”(或半浊音标志)之类的变音标志以及任何其他元素的复合字符。
根据发明的第五方面,与使用除了字符的位置和字符笔划数以外的任何条件的情况相比,可以减少用于指定满足用于确定诸如“dakuten”(或浊音标志)或者“handakuten”(或半浊音标志)之类的变音标志的预定条件的字符的处理所需的时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110271956.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:料盒提取设备
- 下一篇:一种分布式集群系统及其实现方法