[发明专利]图像识别翻译方法、装置、设备及可读存储介质有效
申请号: | 201811027649.7 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109598185B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 徐崴;陈继东 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/414;G06V20/62;G06V20/20;G06V30/146;G06V30/148;G06V30/19;G06V10/82;G06F40/58;G06F40/109 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 翻译 方法 装置 设备 可读 存储 介质 | ||
1.一种图像识别翻译方法,其特征在于,包括:
对图像进行预处理,以得到图像中的文字被调整到规范姿态的版面,其中,所述规范姿态为所述文字的姿态与对图像的正面视角垂直坐标系一致;
对所述版面上的规范姿态的文字以字为单位进行识别和版面分析以将所述版面上的成行文字和成列文字分别定位;
以行和列为单位对规范姿态的文字进行检测以检测出成行文字和成列文字,并且以行和列为单位对检测出的成行文字和成列文字进行识别;
根据对检测出的成行文字和成列文字进行识别的识别结果对文字进行翻译,并且依据所述版面上的成行文字和成列文字的定位显示翻译结果以替换原文。
2.根据权利要求1所述的方法,其特征在于,所述对规范姿态的文字以字为单位进行识别和版面分析以将所述版面上的成行文字和成列文字分别定位,包括:
将所述版面上的全部成列文字改变位置和朝向以形成字顶朝向为左方的成行文字;
将成行文字分割为逐个字并按行分组进行逐字识别,并且将各组成行文字整体顺时针旋转90度以转换为对应的成列文字进行逐字识别,其中,仅字顶朝向为上方的字被识别出来;
确定各组成行文字的初始状态为成行文字还是为成列文字,其中,当一组成行文字被识别出的字数大于该组文字对应的成列文字被识别出的字数时,确定该组成行文字的初始状态为成行文字;并且当一组成行文字被识别出的字数小于该组文字对应的成列文字被识别出的字数时,确定该组成行文字的初始状态为成列文字。
3.根据权利要求2所述的方法,其特征在于,所述将所述版面上的全部成列文字改变位置和朝向以形成字顶朝向为左方的成行文字,包括:
检测所述版面的各个文字区域的宽度和高度,并且当检测到所述版面的文字区域的宽度小于高度时,确定该文字区域中的文字为成列文字,将成列文字整体逆时针旋转90度以转换为字顶朝向为左方的成行文字。
4.根据权利要求1所述的方法,其特征在于,所述以行和列为单位对规范姿态的文字进行检测以检测出成行文字和成列文字,包括:
通过同一种区域级别检测算法来检测成行文字以及成列文字。
5.根据权利要求4所述的方法,其特征在于,所述以行和列为单位对检测出的成行文字和成列文字进行识别,包括:
通过同一种识别算法以行和列为单位来识别成行文字以及成列文字,其中,在对成列文字进行识别时,通过将所述成列文字整体逆时针旋转90度以转换为字顶朝向为左方的成行文字,以行为单位进行识别。
6.根据权利要求1所述的方法,其特征在于,所述依据所述版面上的成行文字和成列文字的定位显示翻译结果以替换原文,包括:
将所述版面上的成行文字和成列文字处的原文去除;
将所述原文的翻译结果按照与原文相同的字顶朝向逐字符地粘贴在原文所在位置处,并且调整所述翻译结果的字符大小以及行数或列数以使所述翻译结果适于显示在所述原文所在的显示区域中,其中,当所述原文为成行文字时,所述翻译结果为至少一行成行文字;并且当所述原文为成列文字时,所述翻译结果为至少一列成列文字。
7.根据权利要求1所述的方法,其特征在于,所述对图像进行预处理,以得到图像中的文字被调整到规范姿态的版面,包括:
通过文字区域分割算法对所述图像上的各个像素点进行是否为文字的二分类训练及预测,输出各个像素点是否为文字的二值图像;
对所述二值图像进行连通域计算,并且去除所述二值图像中的文字行列中的噪音;
检测文字区域的倾斜角度,并且根据检测出的倾斜角度将所述文字区域调整到竖直方向,以得到图像中的文字被调整到规范姿态的版面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811027649.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序