[发明专利]一种用于改善图像识别模型领域变换现象的方法有效
申请号: | 202011018379.0 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112149738B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 谭志;刘兴业 | 申请(专利权)人: | 北京建筑大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 刘源 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 改善 图像 识别 模型 领域 变换 现象 方法 | ||
本发明提供的一种用于改善图像识别模型领域变换现象的方法,运用了遗传算法,通过为每个属性赋予一个权重值,在对属性的搜索过程中不断更新属性的权重值。根据属性的权重值计算每个属性被搜索的概率,权重值越小的属性的被搜索概率也就越大,反之被搜索的概率越小。根据每个属性的被搜索概率对属性进行搜索,可以控制搜索的方向,从而避免某些属性被搜索次数过多或者被搜索次数过少。通过将Equal函数和Sum函数结合运用,完成对属性组合的筛选,改善了计算的复杂过程。在整个过程中使用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络,避免了模型训练过程中会出现小于0的神经元无法更新参数的现象达到了充分提取图像特征的目的。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种用于改善图像识别模型领域变换现象的方法。
背景技术
图像识别,是指利用计算机对图像进行各种处理、分析和理解,是人工智能的一个重要领域。计算机完成对图像的识别主要是依据图像的主要特征,例如数字“6”中有一个“圈”,数字“8”中有两个“圈”等。然而针对不同领域的图像,往往具有不同的主要特征,例如图像的尺寸、通道数、背景颜色等特征都会对图像识别模型产生。但是计算机在识别过程中,不能做到像人的眼睛一样对图像做出自主辩证的判断,无法直接排除一些不必要图像特征的影响并直接找到图像的主要特征从而完成对图像的识别。因此通过训练一个可以跨域识别的图像识别模型对于图像识别领域尤为重要。
但是在研究和实验中,可处理的训练数据通常是针对某个特定的领域制作的,因此训练的模型是针对该特定领域的。在应用中,模型必须处理来其他领域的数据时,该模型的识别准确性会明显降低,得的预测结果会有很大的偏差,这个问题通常被称为“领域变换”现象。例如用每张图像大小为28×28且为单通道的MNIST数据集训练手写数字识别模型,当模型达到令人满意的识别水平(识别的准确率达到99%及以上)时,用该模型识别每张图像大小为32×32且为三通道的SVHN数据集(街景门牌号码数据集),得到的识别准确性会明显降低。虽然两个数据集都是用于训练数字识别模型的,但是两个数据集属于不同的领域(MNIST数据集为手写数字数据集,SVHN数据集为街景门牌号码数据集),图像特性之间存在较大的差异,计算机不能像人一样对两个数据集辩证的识别,因此无法直接判断出相应的差异并准确的“读”出图像中的数字。
为了解决上述问题,Volpi and V.Murino《Addressing Model Vulnerablity toDistributional Shifts Over Image Transformation Sets[C]//Proceedings of theIEEE International Conference on Computer Vision》Seoul,Korea(South):IEEE,2019:p 7979-7988提出了一种组合优化的方式,处理给定模型中图像空间中较易受影响的区域,并将随机搜索算法与遗传算法相结合从而改善通过初始领域训练的模型,使得模型识别其他领域图像的准确性有了显著的提高。该方案的缺点是:
1、在构造属性组合的过程中采用简单的随机搜索方法,不能确保对所有的属性进行均衡搜索,影响遗传算法种群中个体的分布情况。
2、只采用3个属性作为一个属性组合,导致种群中个体过于简单,从而影响了整个遗传算法实现的效果。
3、在筛选待优化属性组合的过程中采用计算模型准确率的方式使计算变得复杂。
4、整个过程中构造的卷积神经网络模型不够完善,会导致对图像的特征提取不够充分。
发明内容
本发明的实施例提供了一种用于改善图像识别模型领域变换现象的方法,用于解决现有技术中存在的问题。
为了实现上述目的,本发明采取了如下技术方案。
一种用于改善图像识别模型领域变换现象的方法,包括:
S1从数据集的图像属性中获得第一属性组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011018379.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:封装器件、电子设备及器件封装方法
- 下一篇:混合云环境下的网络状态监控方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序