[发明专利]字符识别装置和字符识别方法有效
申请号: | 201510313899.7 | 申请日: | 2015-06-09 |
公开(公告)号: | CN105320971B | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 堤庸昂;中岛和树 | 申请(专利权)人: | 株式会社日立信息通信工程 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 装置 方法 | ||
1.一种字符识别装置,具备:输入部,其以光学方式将包括汉字的字符读取为字符图像,该汉字由多个区域的汉字要素构成;图像获取部,其获取使用该输入部读取的字符图像;外部存储部,其保存字符辨别用辞典和同形字符表,该字符辨别用辞典保存有多个标准字符图像,该同形字符表用于按共同的部首、旁将汉字进行分类并且将目视时相像的相似和同形的汉字进行分类;以及运算部,其参照该字符辨别用辞典和同形字符表来控制字符图像的字符识别,其中,该运算部参照字符辨别用辞典对输入的字符图像执行字符识别处理,该字符识别装置的特征在于,
上述运算部包括:
分割区域判定单元,判定按汉字要素对上述图像获取部所获取的1个字符单位的字符图像进行分割的分割区域;
余弦相似度计算单元,计算通过该分割区域判定单元进行了判定的字符图像的同一区域位置处的汉字要素的余弦相似度;
欧几里德距离值计算单元,计算通过上述分割区域判定单元进行了判定的字符图像的同一区域位置处的汉字要素的欧几里德距离值;
同形字符表制作单元,制作将以下字符图像作为相似度高的同形字符进行分组而得到的同形字符表:基于通过上述分割区域判定单元判定出的分割区域的汉字结构相同且同一区域位置的汉字要素之间的基于通过上述余弦相似度计算单元计算出的余弦相似度的相似度高于规定值的字符图像、以及汉字要素之间的通过上述欧几里德距离值计算单元计算出的欧几里德距离值小于规定值的字符图像;以及
标准字符识别单元,将以下字符图像之间的逻辑或的字符图像作为候选字符来进行字符识别:通过上述余弦相似度计算单元计算出的余弦相似度大于规定的余弦相似度的字符图像、通过上述欧几里德距离值计算单元计算出的欧几里德距离值小于规定值的字符图像、以及通过上述同形字符表制作单元将同一区域位置的相似度高的字符图像进行分组而得到的同形字符的字符图像。
2.根据权利要求1所述的字符识别装置,其特征在于,
上述运算部还包括高精度字符识别单元,该高精度字符识别单元基于从通过标准字符识别单元的逻辑或而得到的字符图像中排除通过上述分割区域判定单元分割出的多个分割区域的结构不同的异种候选字符以及该异种候选字符所属的组中包含的字符图像后得到的候选字符,来进行字符识别。
3.根据权利要求1所述的字符识别装置,其特征在于,
上述运算部还包括高速字符识别单元,该高速字符识别单元将通过上述欧几里德距离值计算单元计算出的欧几里德距离值小于规定值的字符图像作为候选字符来进行字符识别。
4.根据权利要求2所述的字符识别装置,其特征在于,
上述运算部还包括高速字符识别单元,该高速字符识别单元将通过上述欧几里德距离值计算单元计算出的欧几里德距离值小于规定值的字符图像作为候选字符来进行字符识别。
5.根据权利要求1至4中的任一项所述的字符识别装置,其特征在于,
上述同形字符表制作单元包括分大组单元和分小组单元,该分大组单元将基于通过上述分割区域判定单元判定出的分割区域的汉字结构相同的字符图像分为大组,该分小组单元将通过该分大组单元分组得到的大组内的、特定区域位置的汉字要素的余弦相似度高于规定值且欧几里德距离值小于规定值的字符图像分为小组,
上述运算部将通过该分大组单元和该分小组单元分组得到的字符图像保存在同形字符表中。
6.根据权利要求4所述的字符识别装置,其特征在于,
上述运算部具备对上述标准字符识别单元、上述高精度字符识别单元以及上述高速字符识别单元进行切换或调整的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立信息通信工程,未经株式会社日立信息通信工程许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510313899.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:卡处理装置及自动交易装置
- 下一篇:一种视频人脸活体检测方法