[发明专利]一种极端条件下场景图像识别方法在审
申请号: | 202210612614.X | 申请日: | 2022-05-31 |
公开(公告)号: | CN114973136A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 李卫东;王帅;汪驰升;白林燕;李祯迎;梁鑫婕;王相业;崔磊 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V30/14;G06V30/18;G06V30/19;G06V10/82;G06N3/04 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 史萌杨 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 极端 条件下 场景 图像 识别 方法 | ||
本发明属于图像识别技术领域,具体涉及一种极端条件下场景图像识别方法,包括,获取待识别图像,将待识别图像输入至图像识别模型中进行识别,得到图像中字符的识别结果;其中,图像识别模型包括特征提取模块、编码器和解码器;特征提取模块用于对输入的图像进行特征提取以获得视觉特征;编码器用于对视觉特征进行编码,以提取语义特征;解码器包括CBAM注意力单元和LSTM注意力单元;CBAM注意力单元用于对视觉特征和语义特征进行解码,获得注意力特征;LSTM注意力单元用于对注意力特征再次解码,获得识别字符的概率分布;图像识别模型利用已知字符的图像作为数据集训练得到。本发明解决了在极端情况下对图像字符识别准确度低的问题。
技术领域
本发明属于图像识别技术领域,具体涉及一种极端条件下场景图像识别方法。
背景技术
工业燃气表被广泛应用于国防、交通、燃气、电力等工业领域。近年来随着生产规模扩大,工业生产中仪表使用率飞速增长,机械燃气表因安装方便快捷,使用周期长,大量用于燃气厂,水厂,变电站等场景下。虽然现有远程抄表系统在一定程度上克服工人手动抄表周期长,人工成本高等问题,但极端成像环境下仍然无法准确、快速识别表盘字符,使得工厂无法精确掌握工业生产中实时数据,影响工业智能化的发展和进步。而工业仪表远程抄表系统中最关键的步骤是对仪表图像数字字符识别。为了提高燃气表字符识别准确率,目前国内外研究者利用多种技术实现仪表字符识别。这些方法虽然可以自动获得理想条件下仪表更准确的识别结果,但操作耗时长,操作过程繁琐,难以推广,特别是极端环境条件下识别效果差。以基于模板匹配法的字符识别为例,首先人工建立规格尺寸一致的标准模板识别库;然后根据标准模板库图像尺寸调整需要识别字符的图像尺寸,使其与模板尺寸匹配;依次计算分割后的每一个待识别字符与模板库中所有字符的相似度,根据相似度大小获得识别结果,而后再将结果输出。虽然这种方法成本低,但该方法需要大量前期工作,计算耗时较长,不同类型的表盘需要制作不同的字符模板。此外,该方法适用于成像质量好且字符规范的仪表,对于仪表图像中不规范字符和成像质量差的表盘,其识别的性能较差。
近年来,由于基于深度学习的计算机视觉方法能够消除结果中的不一致和错误,大量计算机视觉方法取代了传统的手工操作,在各个方面得到了广泛应用,如自动识别系统,缺陷检测等。有学者提出一种堆叠式架构的编码器-解码器字符识别方法,首次使用BiLSTM作为堆叠结构重复计算上下文特征,然而该堆叠块高达12层,计算开销大,推理速度慢,此外BiLSTM也只能对特定长距离表现良好。总之,工业生产中,工厂快速、准确地掌握生产中仪表实时数据,是工业智能化发展和进步的基础。但自然场景下仪表表盘受天气,光照,角度等难以预见的因素影响,导致表盘成像质量差,如存在图像过度曝光、伪影、模糊、字符显示不全、遮挡等问题,远程抄表系统对极端情况下的表盘图像识别效果差,难以满足工业生产需求。
发明内容
本发明的目的在于提供一种极端条件下场景图像识别方法,用以解决极端情况下对字符图像识别准确度低的问题。
为解决上述技术问题,本发明所提供的技术方案以及技术方案对应的有益效果如下:
本发明提供的一种极端条件下场景图像识别方法,包括如下步骤:
1)获取待识别图像;
2)将待识别图像输入至图像识别模型中进行识别,得到图像中字符的识别结果;
其中,所述图像识别模型包括特征提取模块、编码器和解码器;所述特征提取模块用于对输入的图像进行特征提取以获得视觉特征;所述编码器用于对所述视觉特征进行编码,以提取全局语义特征;所述解码器包括CBAM注意力单元和LSTM注意力单元;所述CBAM注意力单元用于对所述全局语义特征进行解码,获得注意力特征;所述LSTM注意力单元用于对所述注意力特征进行解码,获得识别字符的概率分布;所述图像识别模型利用已知字符的图像作为数据集训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210612614.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种好氧堆肥智能控制系统及方法
- 下一篇:AI摄像头避光构件排压成型技术
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序