[发明专利]一种图像文本校正方法、装置、设备及存储介质有效
申请号: | 202110643271.9 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113449724B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 朱亚伦;邵明 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 刘金玲 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 校正 方法 装置 设备 存储 介质 | ||
本申请提供一种图像文本校正方法、装置、设备及存储介质,涉及图像处理技术领域,用于提升自然场景下的文本识别效果。该方法包括:对原始图像进行文本检测,确定原始图像中目标文本所在的目标区域,并基于目标区域生成目标文本掩膜;对目标文本掩膜进行曲线拟合,获得目标文本掩膜的第一曲线,第一曲线用于指示目标文字发生形变的走向;根据第一曲线,确定目标文本掩膜的多条第二曲线;确定校正后的文本图像的边框中与第二曲线对应的多条边框直线,并分别确定多条边框直线中每条边框直线,与相应的第二曲线上的各个点之间的一一对应关系;基于获得的一一对应关系对目标区域进行校正。
技术领域
本申请涉及图像处理技术领域,提供一种图像文本校正方法、装置、设备及存储介质。
背景技术
随着人们生活水平的提高,人们也变得越来越热爱拍摄,但是,在自然场景下进行拍摄,由于角度的问题,例如侧拍,可能会导致拍摄出来的图片中的文本存在倾斜或者弯曲变形等情况,这样图片中的文本便与真实自然场景下的本文存在差异,因此,为了提高对自然场景下文本的识别,通常需要对变形的文本进行校正。
但是,现有的校正方法中大部分只考虑到字符在直线排列情况下的倾斜透视变形,因而,这类方法仅对倾斜透视变形的图像校正有效果,而对其他类型如弯曲变形的校正效果较差。此外,也存在基于人工神经网络的方法来可以解决自然场景下的文本识别效果差的问题,但是,训练网络需要大量图像样本,且完成校正也需要较大计算代价。
发明内容
本申请实施例提供一种图像文本校正方法、装置、设备及存储介质,用于提升自然场景下的文本识别效果。
一方面,提供一种图像文本校正方法,所述方法包括:
对原始图像进行文本检测,确定所述原始图像中目标文本所在的目标区域,并基于所述目标区域生成目标文本掩膜;其中,所述目标区域的外轮廓呈非矩形的形状;
对所述目标文本掩膜进行曲线拟合,获得所述目标文本掩膜的第一曲线,所述第一曲线用于指示所述目标文字发生形变的走向;
根据所述第一曲线,确定所述目标文本掩膜的多条第二曲线;其中,所述第二曲线为与所述第一曲线具有相同走向的所述目标文本掩膜的外轮廓曲线;
确定校正后的文本图像的边框中与所述第二曲线对应的多条边框直线,并分别确定所述多条边框直线中每条边框直线,与相应的第二曲线上的各个点之间的一一对应关系;
基于获得的一一对应关系对所述目标区域进行校正;其中,所述校正后的目标区域的外轮廓呈矩形的形状。
一方面,提供一种图像文本校正装置,所述装置包括:
第一确定单元,用于对原始图像进行文本检测,确定所述原始图像中目标文本所在的目标区域,并基于所述目标区域生成目标文本掩膜;其中,所述目标区域的外轮廓呈非矩形的形状;
曲线拟合单元,用于对所述目标文本掩膜进行曲线拟合,获得所述目标文本掩膜的第一曲线,所述第一曲线用于指示所述目标文字发生形变的走向;
第二确定单元,用于根据所述第一曲线,确定所述目标文本掩膜的多条第二曲线;其中,所述第二曲线为与所述第一曲线具有相同走向的所述目标文本掩膜的外轮廓曲线;
第三确定单元,用于确定校正后的文本图像的边框中与所述第二曲线对应的多条边框直线,并分别确定所述多条边框直线中每条边框直线,与相应的第二曲线上的各个点之间的一一对应关系;
校正单元,用于基于获得的一一对应关系对所述目标区域进行校正;其中,所述校正后的目标区域的外轮廓呈矩形的形状。
可选的,所述第二确定单元,具体用于:
确定所述第一曲线与所述目标文本掩膜的外轮廓之间的两个交点,每个交点对应于所述目标区域中的一个像素点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110643271.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序