[发明专利]一种通用场景文字识别方法及装置在审
申请号: | 202010700929.0 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111986155A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 罗健锋;李仕军;郑伟雄 | 申请(专利权)人: | 广州润普网络科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62;G06T5/50;G06K9/32 |
代理公司: | 广州专理知识产权代理事务所(普通合伙) 44493 | 代理人: | 王允辉 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通用 场景 文字 识别 方法 装置 | ||
1.一种通用场景文字识别方法,其特征在于,所述方法包括:
获取目标自然图像的图像质量信息;
根据所述图像质量信息判断所述目标自然图像是否为可识别图像;
如果是,获取所述目标自然图像的识别等级;
依据所述目标自然图像的识别等级选择相匹配的文本检测策略,并利用所述文本检测策略对所述目标自然图像进行检测,得到所述目标自然图像包含的一块或多块候选文本区域;
利用预先训练得到的文字识别模型对所述候选文本区域进行识别,识别出每个所述候选文本区域的文字内容。
2.根据权利要求1所述的方法,其特征在于,所述获取目标自然图像的图像质量信息之前,所述方法还包括:
采集同一场景下的若干张连续的自然图像;
对所述若干张自然图像进行多帧融合,得到目标自然图像。
3.根据权利要求1或2所述的方法,其特征在于,所述获取目标自然图像的图像质量信息,包括:
获取所述目标自然图像的图像质量评价指标;
基于所述图像质量评价指标确定所述目标自然图像的图像质量信息;其中,所述图像质量评价指标至少包括对比度、饱和度和阴影面积。
4.根据权利要求3所述的方法,其特征在于,根据所述图像质量信息判断所述目标自然图像是否为可识别图像,包括:
当所述对比度位于预设的第一区间、所述饱和度位于预设的第二区间和所述阴影面积小于预设的第三阈值中的至少一项满足时,确定所述目标自然图像为可识别图像。
5.一种通用场景文字识别装置,其特征在于,包括:
第一获取模块,用于获取目标自然图像的图像质量信息;
判断模块,用于根据所述图像质量信息判断所述目标自然图像是否为可识别图像;
第二获取模块,用于在所述判断模块的判断结果为是时,获取所述目标自然图像的识别等级;
选择模块,用于依据所述目标自然图像的识别等级选择相匹配的文本检测策略;
检测模块,用于利用所述文本检测策略对所述目标自然图像进行检测,得到所述目标自然图像包含的一块或多块候选文本区域;
识别模块,用于利用预先训练得到的文字识别模型对所述候选文本区域进行识别,识别出每个所述候选文本区域的文字内容。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
采集模块,用于在所述第一获取模块获取目标自然图像的图像质量信息之前,采集同一场景下的若干张连续的自然图像;
融合模块,用于对所述若干张自然图像进行多帧融合,得到目标自然图像。
7.根据权利要求5或6所述的装置,其特征在于,所述第一获取模块,包括:
获取子模块,用于获取所述目标自然图像的图像质量评价指标;
确定子模块,用于基于所述图像质量评价指标确定所述目标自然图像的图像质量信息;其中,所述图像质量评价指标至少包括对比度、饱和度和阴影面积。
8.根据权利要求7所述的装置,其特征在于,所述判断模块具体用于当所述对比度位于预设的第一区间、所述饱和度位于预设的第二区间和所述阴影面积小于预设的第三阈值中的至少一项满足时,确定所述目标自然图像为可识别图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州润普网络科技有限公司,未经广州润普网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010700929.0/1.html,转载请声明来源钻瓜专利网。