[发明专利]基于注意力机制与多尺度特征的细粒度识别方法及系统在审
申请号: | 202111025778.4 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113743497A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 李泽超;袁呈呈;唐金辉 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 韩雪梅 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 尺度 特征 细粒度 识别 方法 系统 | ||
本发明提供了一种基于注意力机制与多尺度特征的细粒度识别方法及系统,方法包括:获取待识别图片;将待识别图片输入类别确定模型中,得到所述待识别训练图片的类别。本发明中的类别确定模型能够同时捕获图片的整体特征和细节特征,能够提高小样本细粒度识别的识别精度。
技术领域
本发明涉及训练图片识别技术领域,特别是涉及一种基于注意力机制与多尺度特征的细粒度识别方法及系统。
背景技术
小样本学习是机器学习领域一个重要的问题,关注如何使用少量样本就能够识别一类目标。其中,细粒度识别,也称为子类别识别,旨在区分属于同一超类别下不同子类别的对象(例如区分不同种类的狗)。细粒度识别需要区分细微的视觉差异,这比通用对象识别更具挑战性。最近,卷积神经网络的快速发展在这个研究课题上取得了很大进展。然而,一些方法依赖于额外的注释(例如,边界框或部件注释),而这些注释通常需要专业知识。其次,几乎所有的工作都严重依赖于大规模标注良好的训练数据。
小样本细粒度识别是一项新任务,探索如何使用少量标注数据完成细颗粒度识别任务。现有的细颗粒度小样本学习方法,直接使用包含全局信息的整体特征(即大尺度特征,卷积神经网络深层经过较多降采样得到的特征)用于识别任务,忽略了包含局部信息的细节特征(即小尺度特征,卷积神经网络浅层经过较少降采样得到的特征),于是限制训练图片小样本细粒度识别的实现别精度。
发明内容
本发明的目的是提供一种基于注意力机制与多尺度特征的细粒度识别方法及系统,能够提高小样本细粒度识别的识别精度。
为实现上述目的,本发明提供了如下方案:
一种基于注意力机制与多尺度特征的细粒度识别方法,包括:
获取待识别图片;
将所述待识别图片输入类别确定模型中,得到所述待识别训练图片的类别;所述类别确定模型是通过对训练图片的整体特征和细节特征对卷积神经网络进行训练得到的;所述细节特征是利用注意力模块对训练图片进行训练得到的。
可选的,在所述获取待识别图像之前,还包括:
获取多张训练图片作为训练集;所述训练集包括支撑集和查询集;所述支撑集中训练图片的种类数量大于或等于所述查询中训练图片的种类数量;
将所述训练集内的训练图片均输入卷积神经网络中进行特征提取处理,得到每张训练图片的整体特征和空间注意力得分;
根据每张训练图片的空间注意力得分,得到每张训练图片的细节特征;
拼接同一张训练图片的整体特征和细节特征,得到多张训练图片的总特征;
将支撑集内同一类别的多张训练图片的总特征的均值作为类别指标,得到多个类别指标;
根据查询集内每张训练图片的总特征和多个类别指标,利用ProtoNet算法,确定查询集内每张训练图片在每个类别下的类别分数;
将查询集内每张训练图片的类别分数的最大值对应的类别确定为查询集内训练图片的类别;
调整模型参数并返回步骤“将所述训练集内的训练图片均输入卷积神经网络中进行特征提取处理,得到每张训练图片的整体特征和空间注意力得分”直至达到预设迭代次数,得到所述类别确定模型。
可选的,所述将所述训练集内的训练图片均输入卷积神经网络中进行特征提取处理,得到每张训练图片的整体特征和空间注意力得分,具体包括:
确定任一训练图片为当前训练图片;
对所述当前训练图片进行第多次降采样处理,得到所述当前训练图片的多个尺度特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111025778.4/2.html,转载请声明来源钻瓜专利网。