[发明专利]基于Faster Rcnn的图像文本检测方法及系统在审
申请号: | 202111546993.9 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114220091A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张茵翠;关飞;黄敏清;黎康萍;黄达文;吴浩珊;陈冠胜;何晓彤;梁浩麟;伍绍聪 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司肇庆供电局 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/16;G06V30/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李增苗 |
地址: | 510600 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster rcnn 图像 文本 检测 方法 系统 | ||
本发明涉及图像处理技术领域,公开了一种基于Faster Rcnn的图像文本检测方法及系统,其方法通过对待检测图像进行预处理,以提高图像的成像质量,并通过目标检测算法对文本信息进行定位,通过定位信息利用OCR识别算法对文本信息进行文本识别,将文本信息转换为字符信息,从而提高图像识别的准确性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于Faster Rcnn的图像文本检测方法及系统。
背景技术
随着深度学习领域的发展,图像识别、语音识别、自然语言分析技术等人工智能技术的成熟,大量基于人工智能的新一代服务应用被广泛的应用在电力,金融,政府,军事等多个领域,而图像识别技术也得以广泛应用,例如在车牌识别、人脸识别、物体检测等方面,传统的数据收集、数据分析、查询检索方式已经逐渐被智能化方式所取代。但传统的图像识别的图像识别的准确率较低。
发明内容
本发明提供了一种基于Faster Rcnn的图像文本检测方法及系统,解决了图像识别的准确率较低的技术问题。
有鉴于此,本发明第一方面提供了一种基于Faster Rcnn的图像文本检测方法,包括以下步骤:
获取待检测图像,对所述待检测图像进行预处理;
基于目标检测算法检测所述待检测图像中的文本信息的所在位置和文本尺度范围;
基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
优选地,所述目标检测算法集成于Faster-RCNN二阶检测器、SSD一阶检测器和YOLOv3一阶检测器中的其中一种设备。
优选地,所述预处理的方式包括几何变换、畸变校正、去除模糊、图像增强和光线校正。
优选地,所述几何变换的过程具体为,
将所述待检测图像投影至二维几何平面上,对所述待检测图像的外廓进行离散化,以获得外廓离散点集合以及各外廓离散点的原始坐标信息;
根据预先输入的旋转角度和各外廓离散点的原始坐标信息确定所述外廓拐点的坐标变换差值,通过所述坐标变换差值对原始坐标信息进行补偿,从而对所述待检测图像进行几何变换。
优选地,基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息的步骤具体包括:
根据所述文本信息的所在位置和文本尺度范围对所述文本信息进行裁剪,以得到若干个文本区域;
判断相邻的所述文本区域是否重叠,若判定重叠,则将重叠的文本区域合并为同一文本区域;
基于OCR识别算法对所述文本区域内的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
第二方面,本发明还提供了一种基于Faster Rcnn的图像文本检测系统,包括:
预处理模块,用于获取待检测图像,对所述待检测图像进行预处理;
定位模块,用于基于目标检测算法检测所述待检测图像中的文本信息的所在位置和文本尺度范围;
文本识别模块,用于基于OCR识别算法对所述文本信息的所在位置和文本尺度范围对应的文本信息进行文本识别,从而将所述文本信息转化为字符信息。
优选地,所述目标检测算法集成于Faster-RCNN二阶检测器、SSD一阶检测器和YOLOv3一阶检测器中的其中一种设备。
优选地,所述预处理的方式包括几何变换、畸变校正、去除模糊、图像增强和光线校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司肇庆供电局,未经广东电网有限责任公司;广东电网有限责任公司肇庆供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111546993.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序