[发明专利]一种通用场景文字识别方法及装置在审
申请号: | 202010700929.0 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111986155A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 罗健锋;李仕军;郑伟雄 | 申请(专利权)人: | 广州润普网络科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06T5/50;G06K9/32 |
代理公司: | 广州专理知识产权代理事务所(普通合伙) 44493 | 代理人: | 王允辉 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通用 场景 文字 识别 方法 装置 | ||
本发明揭示了一种通用场景文字识别方法及装置。所述方法包括:获取目标自然图像的图像质量信息;根据图像质量信息判断该目标自然图像是否为可识别图像;如果是,获取该目标自然图像的识别等级;依据其识别等级选择相匹配的文本检测策略,并利用该文本检测策略对目标自然图像进行检测,得到该目标自然图像包含的一块或多块候选文本区域;利用预先训练得到的文字识别模型对该候选文本区域进行识别,识别出每个候选文本区域的文字内容。此方法下,能够对自然场景图像进行质量的甄别和优化处理,保证文字识别的准确性和可靠性。
技术领域
本发明涉及图像识别技术领域,特别涉及一种通用场景文字识别方法及装置。
背景技术
自然场景中包含着丰富的文字信息,如商店招牌、道路指示牌以及各种警告提示牌等,如果人们能够将这些文字提取出来,并做进一步处理后将会为图像语义的理解提供非常有利的依据和丰富的信息。
文字提取处理的前提是自然场景图像的获取。目前,大多数自然场景图像都是由人手持手机、平板等电子设备拍摄得到的。人为拍摄容易在拍摄过程中发生抖动,导致拍摄的图像模糊;如果连续拍摄还会受到拍摄环境变化的影响,图像的成像质量参差不齐,进而导致自然场景图像的识别效果不佳。
由此可见,如果不能在对自然场景图像进行文字提取处理之前对该图像进行质量的甄别和优化处理,自然场景图像的文字识别的准确率和可靠性将无法得到保证。
发明内容
为了解决相关技术中存在的无法对自然场景图像进行质量的甄别和优化处理、保证文字识别的准确性和可靠性的技术问题,本发明提供了一种通用场景文字识别方法及装置。
本发明实施例第一方面公开了一种通用场景文字识别方法,所述方法包括:
获取目标自然图像的图像质量信息;
根据所述图像质量信息判断所述目标自然图像是否为可识别图像;
如果是,获取所述目标自然图像的识别等级;
依据所述目标自然图像的识别等级选择相匹配的文本检测策略,并利用所述文本检测策略对所述目标自然图像进行检测,得到所述目标自然图像包含的一块或多块候选文本区域;
利用预先训练得到的文字识别模型对所述候选文本区域进行识别,识别出每个所述候选文本区域的文字内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取目标自然图像的图像质量信息之前,所述方法还包括:
采集同一场景下的若干张连续的自然图像;
对所述若干张自然图像进行多帧融合,得到目标自然图像。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取目标自然图像的图像质量信息,包括:
获取所述目标自然图像的图像质量评价指标;
基于所述图像质量评价指标确定所述目标自然图像的图像质量信息;其中,所述图像质量评价指标至少包括对比度、饱和度和阴影面积。
作为一种可选的实施方式,在本发明实施例第一方面中,根据所述图像质量信息判断所述目标自然图像是否为可识别图像,包括:
当所述对比度位于预设的第一区间、所述饱和度位于预设的第二区间和所述阴影面积小于预设的第三阈值中的至少一项满足时,确定所述目标自然图像为可识别图像。
本发明实施例第二方面公开了一种通用场景文字识别装置,包括:
第一获取模块,用于获取目标自然图像的图像质量信息;
判断模块,用于根据所述图像质量信息判断所述目标自然图像是否为可识别图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州润普网络科技有限公司,未经广州润普网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010700929.0/2.html,转载请声明来源钻瓜专利网。