[发明专利]一种基于注意力机制的目标分类方法及系统在审
申请号: | 202110943944.2 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113762251A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 柴象飞;郭娜;张路;刘鹏飞;秦浩峰 | 申请(专利权)人: | 慧影医疗科技(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 陈霆雷 |
地址: | 100192 北京市海淀区西小口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 目标 分类 方法 系统 | ||
本发明公开了一种基于注意力机制的目标分类方法,涉及神经网络技术领域。包括:获取待分类图像的步骤;将待分类图像输入到卷积神经网络,提取待分类图像的特征,通过注意力矩阵块对得到的特征图进行处理,根据处理后的特征图得到至少一个目标分类结果的步骤。本发明适用于图像中目标物的分类,通过加入注意力机制,使用注意力矩阵块对特征图进行处理,抑制与目标分类相关性低的特征表达,激励与目标相关性大的特征表达,从而更有效地利用全局信息对目标类型进行预测,抑制无关信息对分类结果的干扰,提高目标分类的准确性。此外,本发明不需要对目标周围的局部图像做切割操作,因而不存在图像切割相关的问题,处理过程更加简洁,效率更高。
技术领域
本发明涉及神经网络技术领域,尤其涉及一种基于注意力机制的目标分类方法及系统。
背景技术
深度学习网络在各个领域的应用越来越多,目前,可以使用深度学习网络实现对图像中的目标进行识别和分类。
然而,目标的尺寸依据识别的具体事物决定,当目标的尺寸差异较大时,以同一尺寸切割图块,如果选取的尺寸较大,会出现同一图块中存在多个不同类型目标的情况,在这种情况下,图块内不同类型的目标会干扰最终分类结果;如果选取的尺寸较小,大的目标会被分割到不同的图块中,则对该大目标的分类也会不准确,因为输入到深度学习网络中的信息只包含该大目标的一部分信息。
而如果对大尺寸目标以较大的尺寸切割图块,小尺寸目标以较小的尺寸切割图块,按现有方案,在输入学习网络之前需要将图块尺寸调整到一致,而在调整过程中将会引入更多的噪声,从而对最终分类结果造成影响,影响分类的准确性。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种基于注意力机制的目标分类方法及系统。
本发明解决上述技术问题的技术方案如下:
一种基于注意力机制的目标分类方法,包括:
获取待分类图像的步骤;
将所述待分类图像输入到卷积神经网络,提取所述待分类图像的特征,通过注意力矩阵块对得到的特征图进行处理,根据处理后的特征图得到至少一个目标分类结果的步骤。
本发明解决上述技术问题的另一种技术方案如下:
一种基于注意力机制的目标分类系统,包括:采集设备、处理设备和显示设备,其中:
所述采集设备用于获取待分类图像;
所述处理设备用于将所述待分类图像输入到卷积神经网络,提取所述待分类图像的特征,通过注意力矩阵块对得到的特征图进行处理,根据处理后的特征图得到至少一个目标分类结果;
所述显示设备用于显示所述待分类图像的至少一个目标分类结果。
本发明的有益效果是:本发明提供的方法及系统,适用于图像中目标物的分类,通过加入注意力机制,使用注意力矩阵块对特征图进行处理,抑制与目标分类相关性低的特征表达,激励与目标相关性大的特征表达,从而更有效地利用全局信息对目标类型进行预测,抑制无关信息对分类结果的干扰,提高目标分类的准确性。此外,本发明不需要对目标周围的局部图像做切割操作,因而不存在图像切割相关的问题,处理过程更加简洁,效率更高。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明目标分类方法的实施例提供的流程示意图;
图2为本发明目标分类方法的实施例提供的卷积神经网络结构示意图;
图3为本发明目标分类方法的其他实施例提供的注意力层结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧影医疗科技(北京)有限公司,未经慧影医疗科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110943944.2/2.html,转载请声明来源钻瓜专利网。