[发明专利]基于Faster Rcnn的图像文本检测方法及系统在审
申请号: | 202111546993.9 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114220091A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张茵翠;关飞;黄敏清;黎康萍;黄达文;吴浩珊;陈冠胜;何晓彤;梁浩麟;伍绍聪 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司肇庆供电局 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/16;G06V30/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李增苗 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster rcnn 图像 文本 检测 方法 系统 | ||
1.基于Faster Rcnn的图像文本检测方法,其特征在于,包括以下步骤:
获取待检测图像,对所述待检测图像进行预处理;
基于目标检测算法检测所述待检测图像中的文本信息的所在位置和文本尺度范围;
基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
2.根据权利要求1所述的基于Faster Rcnn的图像文本检测方法,其特征在于,所述目标检测算法集成于Faster-RCNN二阶检测器、SSD一阶检测器和YOLOv3一阶检测器中的其中一种设备。
3.根据权利要求1所述的基于Faster Rcnn的图像文本检测方法,其特征在于,所述预处理的方式包括几何变换、畸变校正、去除模糊、图像增强和光线校正。
4.根据权利要求3所述的基于Faster Rcnn的图像文本检测方法,其特征在于,所述几何变换的过程具体为,
将所述待检测图像投影至二维几何平面上,对所述待检测图像的外廓进行离散化,以获得外廓离散点集合以及各外廓离散点的原始坐标信息;
根据预先输入的旋转角度和各外廓离散点的原始坐标信息确定所述外廓拐点的坐标变换差值,通过所述坐标变换差值对原始坐标信息进行补偿,从而对所述待检测图像进行几何变换。
5.根据权利要求1所述的基于Faster Rcnn的图像文本检测方法,其特征在于,基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息的步骤具体包括:
根据所述文本信息的所在位置和文本尺度范围对所述文本信息进行裁剪,以得到若干个文本区域;
判断相邻的所述文本区域是否重叠,若判定重叠,则将重叠的文本区域合并为同一文本区域;
基于OCR识别算法对所述文本区域内的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
6.基于Faster Rcnn的图像文本检测系统,其特征在于,包括:
预处理模块,用于获取待检测图像,对所述待检测图像进行预处理;
定位模块,用于基于目标检测算法检测所述待检测图像中的文本信息的所在位置和文本尺度范围;
文本识别模块,用于基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
7.根据权利要求6所述的基于Faster Rcnn的图像文本检测系统,其特征在于,所述目标检测算法集成于Faster-RCNN二阶检测器、SSD一阶检测器和YOLOv3一阶检测器中的其中一种设备。
8.根据权利要求6所述的基于Faster Rcnn的图像文本检测系统,其特征在于,所述预处理的方式包括几何变换、畸变校正、去除模糊、图像增强和光线校正。
9.根据权利要求8所述的基于Faster Rcnn的图像文本检测系统,其特征在于,还包括:几何变换模块,所述几何变换模块用于将所述待检测图像投影至二维几何平面上,对所述待检测图像的外廓进行离散化,以获得外廓离散点集合以及各外廓离散点的原始坐标信息;还用于根据预先输入的旋转角度和各外廓离散点的原始坐标信息确定所述外廓拐点的坐标变换差值,通过所述坐标变换差值对原始坐标信息进行补偿,从而对所述待检测图像进行几何变换。
10.根据权利要求6所述的基于Faster Rcnn的图像文本检测系统,其特征在于,所述文本识别模块具体包括:
裁剪模块,用于根据所述文本信息的所在位置和文本尺度范围对所述文本信息进行裁剪,以得到若干个文本区域;
合并模块,用于判断相邻的所述文本区域是否重叠,若判定重叠,则将重叠的文本区域合并为同一文本区域;
识别模块,用于基于OCR识别算法对所述文本区域内的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司肇庆供电局,未经广东电网有限责任公司;广东电网有限责任公司肇庆供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111546993.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序