[发明专利]基于非对称卷积残差网络的细粒度图像分类方法及系统有效
申请号: | 202211463851.0 | 申请日: | 2022-11-22 |
公开(公告)号: | CN116310476B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 谭志;胥子皓 | 申请(专利权)人: | 北京建筑大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 邹芳德 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对称 卷积 网络 细粒度 图像 分类 方法 系统 | ||
本发明提供一种基于非对称卷积残差网络的细粒度图像分类方法及系统,属于计算机视觉技术领域,获取待分类图像;利用预先训练好的分类模型对获取的待分类图像进行处理,得到分类结果;其中,所述预先训练好的分类模型包括特征提取模块和分类模块;所述特征提取模块包括多个通道数依次递增的特征提取子模块;每个所述特征提取子模块均包括一个通道混洗单元和多个非对称残差单元。本发明在降低残差网络整体计算数据量和模型复杂度的同时提升了模型效果;非对称卷积的使用成功降低了模型复杂度和计算数据量并提升了模型的分类效果;增强了网络的特征提取能力并提升了模型效果。
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种基于非对称卷积残差网络的细粒度图像分类方法及系统。
背景技术
细粒度图像分类问题是计算机视觉领域的一个热门问题,它是指在对图像中的物体进行较为粗糙的大类别划分之后,继续进行的更精细的小类别划分任务。也正因如此细粒度图像分类任务和通常的图像分类任务相比其难点在于类别之间差异较小而类别之内差异较大。
细粒度图像分类任务的意义在于无论是工业界还是学术界都存在着广泛的研究需求和应用场景。例如在生态保护中有效识别不同种类的生物,可以为生态研究提供十分有效的帮助。而如果借助计算机视觉技术来低成本高效率的实现这一目的,那么无论对于学术界还是工业界而言都有着非常重要的意义。
Fadi等人提出了一种弹性优化方式,通过把从高斯分布函数中的返回值加入到损失函数中以限制类别间的距离,从而实现分类的目的。该方法在诸如人脸识别等多个细分领域都取得了十分优秀的成果。其实现过程大致如下。第一步,在训练模型前,将数据集的图像经过预处理后统一大小和通道数;第二步,将预处理好的图像送入神经网络中进行特征提取,网络由卷积层、池化层、归一化层、残差连接、激活函数和损失函数组成。图像将首先经过5×5卷积层、归一化层、最大值池化层和Prelu激活函数层进行初步的特征提取;第三步,图像将随后根据网络回传的参数选择进入分别由3×3卷积层、归一化层、Prelu激活函数层、3×3卷积层、归一化层组成的基本模块主通路,或是进入残差连接的高速通路绕过这一模块并多次重复这一过程直至通过所有组成模块以完成特征提取操作;第四步,将第三步中提取到的特征进行重新排列后传入Softmax函数进行分类;第五步,从设置好的高斯分布函数中随机返回一个值添加到Sofmax函数中对特征分类过程进行限制以达到增大类间差异提高模型表现的目的;第六步将分类好的特征传入交叉熵损失函数对效果进行评估并反向回传相关参数指导模型训练,之后经计算得出准确率结果。
然而上述现有的技术仍存在以下几个方面的问题:过度关注模型表现而忽略了模型部署和实现的难易程度,虽然表现十分优秀但过高的模型复杂度导致了难以部署到小型设备中从而造成了难以实现的问题;注意力主要集中于激活函数和损失函数的优化中而忽略了它们之间的配合,使得模型的发展落后于函数方法;模型中使用的特征提取方式效率较低,无法很好的平衡模型复杂度和模型表现。
发明内容
本发明的目的在于提供一种基于非对称卷积残差网络的细粒度图像分类方法及系统,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种基于非对称卷积残差网络的细粒度图像分类方法,包括:
获取待分类图像;
利用预先训练好的分类模型对获取的待分类图像进行处理,得到分类结果;其中,所述预先训练好的分类模型包括特征提取模块和分类模块;所述特征提取模块包括多个通道数依次递增的特征提取子模块;每个所述特征提取子模块均包括一个通道混洗单元和多个非对称残差单元,通道混洗模块用于对输入的特征图进行通道数统一;非对称残差单元包括一组非对称卷积组和两个1×1卷积和多个穿插其中的BN层组成,两端的1×1卷积用于通道之间的信息交换,中间的非对称卷积组用于对特向进行特征提取,特征提取后和原始信息相加输入函数处理层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211463851.0/2.html,转载请声明来源钻瓜专利网。