[发明专利]文本透视变换方法及设备在审
申请号: | 202111168050.7 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113850220A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 谭黎敏;龚霁程;赵钊 | 申请(专利权)人: | 上海西井信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04;G06N3/08;G06F17/16 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
地址: | 200050 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 透视 变换 方法 设备 | ||
1.一种文本透视变换方法,其特征在于,用于对包含标准文本的待检测图像进行处理,所述标准文本包括位于文本主体同侧的第一标识码以及第二标识码,所述文本透视变换方法包括:
识别所述待检测图像中的第一标识码和所述第二标识码的位置;
根据所述第一标识码和第二标识码的位置,旋转所述待检测图像;
识别经旋转的所述待检测图像的文本主体的四个角点;
根据所述文本主体的四个角点对经旋转的所述待检测图像进行透视变换。
2.如权利要求1所述的文本透视变换方法,其特征在于,所述识别所述待检测图像中的第一标识码和所述第二标识码的位置包括:
通过第一卷积神经网络对所述待检测图像进行特征提取;
根据所提取的特征分别识别所述第一标识码和所述第二标识码的位置,
其中,所述第一卷积神经网络模型包括多个串接和/或并接的瓶颈模块,每个瓶颈模块包括串接的多个基础模块以及一个跳接链接层,每个所述基础模块包括串接的归一化层、激活层以及卷积层。
3.如权利要求2所述的文本透视变换方法,其特征在于,每个瓶颈模块包括的基础模块的数量为三个,从所述瓶颈模块的输入至输出的方向,所述基础模块的卷积核依次为1*1、3*3以及1*1。
4.如权利要求2所述的文本透视变换方法,其特征在于,所述通过第一卷积神经网络对所述待检测图像进行特征提取包括:
通过第一卷积神经网络对所述待检测图像进行特征提取以获得第一准特征图和第二准特征图,所述第二准特征图的下采样倍数为所述第一准特征图的下采样倍数的两倍;
将所述第二准特征图进行2倍上采样;
将经上采样的第二准特征图与所述第一准特征图融合获得第一特征图。
5.如权利要求2所述的文本透视变换方法,其特征在于,所述根据所提取的特征分别识别所述第一标识码和所述第二标识码的位置采用第一识别模型,所述第一识别模型采用分类损失和回归损失进行训练,所述分类损失为交叉熵损失,所述回归损失为均方差损失。
6.如权利要求1所述的文本透视变换方法,其特征在于,所述根据所述第一标识码和第二标识码的位置,旋转所述待检测图像包括:
获取所述第一标识码和第二标识码的中心点坐标;
判断所述第一标识码和第二标识码的中心点坐标的第二坐标轴的坐标差是否大于第一坐标轴的坐标差;
若是,则将所述待检测图像顺时针或逆时针旋转90度;
判断所述第一标识码的中心点坐标的第一坐标轴的坐标是否大于所述第二标识码的中心点坐标的第一坐标轴的坐标;
若是,则将所述待检测图像旋转180度。
7.如权利要求1所述的文本透视变换方法,其特征在于,所述识别经旋转的所述待检测图像的文本主体的四个角点包括:
通过第二卷积神经网络对经旋转的所述待检测图像进行特征提取获得第二特征图;
根据所述第二特征图识别所述文本主体的四个角点,
其中,所述第二卷积神经网络模型包括多个串接和/或并接的瓶颈模块,每个瓶颈模块包括串接的多个基础模块以及一个跳接链接层,每个所述基础模块包括串接的归一化层、激活层以及卷积层。
8.如权利要求7所述的文本透视变换方法,其特征在于,所述根据所提取的特征识别所述文本主体的四个角点包括:
对所述第二特征图分别进行第一卷积操作和第二卷积操作以获得第一输出层和第二输出层,所述第一输出层输出的值指示当前位置是否有文本,所述第二输出层输出文本主体的四个角点的偏移量。
9.如权利要求1所述的文本透视变换方法,其特征在于,所述根据所述文本主体的四个角点对经旋转的所述待检测图像进行透视变换包括;
根据所述文本主体的四个角点的位置以及设定的变换后的文本主体的四个角点的位置计算透视变换矩阵;
将所述透视变换矩阵与经旋转的所述待检测图像相乘,以获得经矫正的图像。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行:
如权利要求1至9任一项所述的文本透视变换方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海西井信息科技有限公司,未经上海西井信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111168050.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轻触开关及其接线方法
- 下一篇:一种低功耗宽电压范围振荡器