[发明专利]一种基于级联增强网络的图片细粒度分类方法在审
申请号: | 202010782565.5 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112052877A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 吕岱霖;戚武滕;王亚奇;王琳艳;章一帆;孙玲玲 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/68;G06N3/04;G06T7/11 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 增强 网络 图片 细粒度 分类 方法 | ||
本发明公开了一种基于级联增强网络的图片细粒度分类方法。主要包括构建级联了SEME‑ResNet50和SEME‑DenseNet169的Cascade‑SEMEnet网络结构、用自适应的直方图均衡化方法对原始数据进行预处理、在网络中添加MoEx、SE、和GAP模块来增强图像特征、改变网络对各通道的满意度以及使网络获得更大的感受野。然后利用了区域学习的训练方法,来减轻非目标特征对网络训练造成的影响。评估结果证明该方法也能够有效的修正非目标特征对网络造成的影响。最后使用Grad‑CAM可视化了网络的判断依据,定位出可能的目标特征区域,来验证网络有效性的。本发明能够避免神经网络在训练过程中学习错误的信息,加强神经网络分类的有效性。
技术领域
本发明涉及深度学习、计算机视觉领域,是利用深度学习技术对图片特征区域进行检测和细粒度分类的技术。
背景技术
2010年以后,借助于深度学习的力量,计算机视觉技术得到了爆发增长和产业化。通过深度神经网络,各类视觉相关任务的识别精度都得到了大幅提升。在全球最权威的计算机视觉竞赛ILSVR(ImageNet Large Scale Visual Recognition Competition)上,千类物体识别Top-5错误率在2010年和2011年时分别为28.2%和25.8%,从2012年引入深度学习之后,后续4年分别为16.4%、11.7%、6.7%、3.7%,出现了显著突破。
计算机视觉技术的应用场景也快速扩展,除了在比较成熟的安防领域应用外,也有应用在金融领域的人脸识别身份验证、电商领域的商品拍照搜索、医疗领域的智能影像诊断、机器人/无人车上作为视觉输入系统等,包括许多有意思的场景:照片自动分类(图像识别+分类)、图像描述生成(图像识别+理解)等等。
计算机视觉是指利用计算机来模拟人的视觉,是人工智能中的“看”。从技术流程上来说,分为目标检测、目标识别、行为识别三个部分。根据识别的目标种类可以分为图像识别、物体识别、人脸识别、文字识别等。在智能机器人领域,计算机视觉可以对静态图片或动态视频中的物体进行特征提取、识别和分析,从而为后续的动作和行为提供关键的信息。
现有的图像分类网络通常采取多个卷积块串联的方法,通过残差学习增加网络的深度。但是由于卷积块不同的输出通道提取到的信息并不相同,网络很可能会混合过多的非目标的特征信息,以及,传统的数据增强方法只能单一的增强图像,起到的效果很局限。此外,传统的训练方式会受到非目标特征的干扰,造成较大的负面影响,这些问题都会使分类的结果准确度偏低。
发明内容
针对现有技术的不足,本发明提出了一种基于级联增强网络的图片细粒度分类方法,通过在网络中加入SE注意力结构和MoEx模块,使网络着重分析目标的重要特征,并引入区域学习的训练方法,消除训练过程中非目标特征造成的负面影响,提高分类准确度。
一种基于级联增强网络的图片细粒度分类方法,具体包括以下步骤:
步骤1、构建网络级联结构。
构建级联了子网络SEME-ResNet50和SEME-DenseNet169的Cascade-SEMEnet网络结构。
步骤2、处理与增强数据。
2.1、为解决因拍摄环境影响导致的图片中存在的一些噪声与不清晰的轮廓区域,对待训练的数据进行预处理,让图像中不同物体的分界线更清晰,并且减少数据的噪声对神经网络的影响。
2.2、利用MoEx结构提高网络的特征提取能力。MoEx结构存在于两个子网络的第一层卷积层,混合了一个实例的标准化特征与另一个实例的特征矩阵,在子网络推理过程中对图像特征进行增强。归一化函数为F,为l层第i个输入xi的特征,经过归一化函数处理后,得到三个输出值:标准化特征一阶矩μi,二阶矩σi:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010782565.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种开关电容型单端转差分电路
- 下一篇:一种直升机刚性旋翼桨毂