[发明专利]一种文字识别、文字翻译方法和装置在审
申请号: | 201811025938.3 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109271910A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 徐崴;李亮 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 竖排 文字区域 文字识别 方法和装置 目标图像 文字翻译 申请 | ||
本申请公开了一种文字识别、文字翻译方法和装置,该文字识别方法包括:获取包含至少一列竖排文字的目标图像;对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;对所述至少一个竖排文字区域进行识别,得到与所述至少一个竖排文字区域一一对应的文字。
技术领域
本申请涉及文字处理技术领域,尤其涉及一种文字识别、文字翻译方法和装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)技术是一种新型的文字识别技术,可以通过图像处理和模式识别技术对图片中的光学字符进行识别,并将光学字符翻译成计算机文字。随着OCR技术的飞速发展,OCR技术被越来越多的应用在各种文字识别的场景中。
然而,在实际应用中,OCR技术通常仅能对多数场景下横向排版的文字进行识别,不能对某些特殊场景下竖向排版的文字进行有效识别,例如,可以对文献资料中横向排版的文字进行识别,但不能对公交站牌中竖向排版的站点名称进行有效识别,从而影响用户的使用体验。
发明内容
本申请实施例提供一种文字识别、文字翻译方法和装置,用于解决现有的OCR技术不能对竖向排版的文字进行识别,影响用户的使用体验的问题。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出一种文字识别方法,包括:
获取包含至少一列竖排文字的目标图像;
对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;
对所述至少一个竖排文字区域进行识别,得到与所述至少一个竖排文字区域一一对应的文字。
第二方面,提出一种文字识别装置,包括:
获取单元,获取包含至少一列竖排文字的目标图像;
处理单元,对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;
识别单元,对所述至少一个竖排文字区域进行识别,得到与所述至少一个竖排文字区域一一对应的文字。
第三方面,提出一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,该可执行指令在被执行时使该处理器执行以下操作:
获取包含至少一列竖排文字的目标图像;
对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;
对所述至少一个竖排文字区域进行识别,得到与所述至少一个竖排文字区域一一对应的文字。
第四方面,提出一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下方法:
获取包含至少一列竖排文字的目标图像;
对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;
对所述至少一个竖排文字区域进行识别,得到与所述至少一个竖排文字区域一一对应的文字。
第五方面,提出一种文字翻译方法,包括:
获取包含至少一列竖排文字的目标图像;
对所述目标图像进行处理,得到至少一个竖排文字区域,一个所述竖排文字区域对应一列所述竖排文字;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811025938.3/2.html,转载请声明来源钻瓜专利网。