[发明专利]图像识别翻译方法、装置、设备及可读存储介质有效
申请号: | 201811027649.7 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109598185B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 徐崴;陈继东 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/414;G06V20/62;G06V20/20;G06V30/146;G06V30/148;G06V30/19;G06V10/82;G06F40/58;G06F40/109 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 翻译 方法 装置 设备 可读 存储 介质 | ||
本公开实施例提供图像识别翻译方法、装置、设备及可读存储介质。图像识别翻译方法包括:对图像进行预处理,以得到图像中的文字被调整到规范姿态的版面,其中,规范姿态为文字的姿态与对图像的正面视角垂直坐标系一致;对版面上的规范姿态的文字以字为单位进行识别和版面分析以将版面上的成行文字和成列文字分别定位;以行和列为单位对规范姿态的文字进行检测以检测出成行文字和成列文字,并且以行和列为单位对检测出的成行文字和成列文字进行识别;根据对检测出的成行文字和成列文字进行识别的识别结果对文字进行翻译,并且依据版面上的成行文字和成列文字的定位显示翻译结果以替换原文,能自动框选图像中的文字区域,从而减轻用户负担。
技术领域
本公开实施例涉及计算机技术领域,尤其涉及图像识别翻译方法、装置、设备及可读存储介质。
背景技术
随着通用场景光学字符识别(OCR)技术的发展,图像翻译技术目前在业界已经得到了普遍应用,出现了各种翻译APP并获得了大量下载。这些翻译APP可以较好地解决一些生活中常见的横向场景文字翻译问题,如菜单翻译、横版书翻译等,但对竖向排版的文字如公交站牌、竖版文章等的翻译上却不尽人意。这主要是因为这些翻译APP内带的OCR字符识别算法通常只能固定识别横向排版的文字,对竖向排版的公交站牌、竖版文章中的文字无法处理。
另外一个问题就是这些翻译APP自动化程度普遍较低,需要用户手工圈定待翻译的文字部分作为输入,不能自动定位文字区域并予以识别。对于公交站牌、书页等文字密集分布的物体。这种交互方式意味着用户需要做大量的文字圈定工作,用户负担很重、体验不好。
因此,亟需一种无需手工圈定文字区域即可对横版以及竖版文字进行图像识别翻译的方法。
发明内容
有鉴于此,本公开第一方面提供了一种图像识别翻译方法,包括:
对图像进行预处理,以得到图像中的文字被调整到规范姿态的版面,其中,所述规范姿态为所述文字的姿态与对图像的正面视角垂直坐标系一致;
对所述版面上的规范姿态的文字以字为单位进行识别和版面分析以将所述版面上的成行文字和成列文字分别定位;
以行和列为单位对规范姿态的文字进行检测以检测出成行文字和成列文字,并且以行和列为单位对检测出的成行文字和成列文字进行识别;
根据对检测出的成行文字和成列文字进行识别的识别结果对文字进行翻译,并且依据所述版面上的成行文字和成列文字的定位显示翻译结果以替换原文。
本公开第二方面提供了一种图像识别翻译装置,包括:
图像预处理模块,被配置为对图像进行预处理,以得到图像中的文字被调整到规范姿态的版面,其中,所述规范姿态为所述文字的姿态与对图像的正面视角垂直坐标系一致;
版面分析模块,被配置为对所述版面上的规范姿态的文字以字为单位进行识别和版面分析以将所述版面上的成行文字和成列文字分别定位;
行列文字检测及识别模块,被配置为以行和列为单位对规范姿态的文字进行检测以检测出成行文字和成列文字,并且以行和列为单位对检测出的成行文字和成列文字进行识别;
翻译及排版模块,被配置为根据对检测出的成行文字和成列文字进行识别的识别结果对文字进行翻译,并且依据所述版面上的成行文字和成列文字的定位显示翻译结果以替换原文。
本公开第三方面提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面所述的方法。
本公开第四方面提供了一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811027649.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序