[发明专利]基于类间相似度的分布式标签的细粒度图像识别算法有效
申请号: | 202110386579.X | 申请日: | 2021-04-12 |
公开(公告)号: | CN113159066B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 唐振民;孙泽人;姚亚洲;杜鹏桢 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210094 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相似 分布式 标签 细粒度 图像 识别 算法 | ||
本发明公开了基于类间相似度的分布式标签的细粒度图像识别算法,包括以下步骤:(1)使用骨干网络提取输入图像的特征表示;(2)利用中心损失模块通过特征表示计算中心损失并更新类别中心;(3)分类损失模块利用特征表示和最终标签分布计算分类损失(例如交叉熵损失),其中的最终标签分布通过计算独热标签分布和由类别中心生成的分布式标签分布的加权和得到;(4)由中心损失和分类损失加权求和得到最终的目标损失函数,以此优化整个模型。本发明通过降低模型预测的确信度有效地缓解了过拟合的问题,能够精确地学习细粒度数据的辨别性特征,精确高效地区分不同细粒度类别的数据,可广泛应用于视觉分类和多媒体领域。
技术领域
本发明涉及细粒度图像识别方法,特别涉及一种基于类间相似度的分布式标签的细粒度图像识别算法。
背景技术
图像识别,旨在对给定图像进行类别判定划分,是计算机视觉领域一个核心的研究课题。一般的图像识别任务(例如区分飞机、舰船、狗、猫动物等,区分不同的手写数字,区分各种不同类的对象,等等)旨在对不同大类的图像进行分类识别。细粒度图像识别,作为图像识别的一个重要而极具挑战性的子类,一直是一个活跃的计算机视觉研究领域。细粒度识别任务的目标是识别出同一个大类下的不同子类(比如区分不同类别的鸟、飞机、汽车等)。在现实生活中,细粒度图像识别有着非常广泛的应用场景,例如生物多样性观测、生态研究、气候变化评估、遥感图像识别、智能零售、智能交通、智能监控等等。因此一直受到工业节和学术界的广泛关注。
早期在深度卷积神经网络还未体现出在计算机视觉方面的强大学习的能力的时期,研究者们尝试在传统粗粒度图像识别的算法上进行研究和改进。近年来,随着算力的不断提升,深度学习技术逐渐成为学习特征表示的强大方法,在计算机视觉领域的各方面均取得了瞩目的成果与巨大的突破,这其中也包括细粒度识别。
细粒度图像识别可以区分同一大类下不同子类的细微差别,例如区分北极燕鸥和里海燕鸥。但是,适用于一般图像识别(粗粒度图像识别)任务的网络模型在细粒度识别任务中无法取得理想的效果,这主要是因为以下两个因素:(1)图像类间差异小:由于细粒度类别隶属于同一个大类(例如Acura RL Sedan 2012和Buick Verano Sedan 2012均属于汽车这一父类),因此不同类别的图像往往具有相似的特征,这导致细粒度类别之间具有较高的相似性;(2)图像类内差异大:由于图像采集过程中光照、角度、遮挡、乃至采集设备的参数性能等方面的不同,同类别的图像往往视觉差异较大,尤其是细粒度类间相似度高这一情况的存在,使得同类别内图像之间的较大差异性在细粒度识别任务中变得尤为明显。
发明内容
发明目的:本发明提供一种引入细粒度类别之间的相似度信息,通过降低模型预测的确信度以有效地缓解网络过拟合问题,促使网络学到了更强力的细粒度特征表示的基于类间相似度的分布式标签的细粒度图像识别算法。
技术方案:基于类间相似度的分布式标签的细粒度图像识别算法,包括以下步骤:
(1)使用骨干网络提取输入图像的特征表示X,将提取到的图像特征表示输入到两个并行的模块;所述模块为中心损失模块及分类损失模块;
(2)中心损失模块通过特征表示X计算中心损失并更新类别中心C;
(3)计算独热标签分布和由类别中心C生成的分布式标签分布的加权和得到最终标签分布;
(4)分类损失模块利用特征表示X和最终标签分布计算分类交叉熵损失;
(5)由中心损失和分类损失加权求和得到最终用于优化整个模型的目标损失函数。
优选的,步骤(1)中,所述使用骨干网络提取输入图像特征为预先在ImageNet数据集上进行预训练的ResNet50网络。
优选的,步骤(2)中,所述中心损失模块通过特征表示X计算中心损失并更新类别中心C具体过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110386579.X/2.html,转载请声明来源钻瓜专利网。