[发明专利]一种基于二阶特征的鸟类细粒度识别方法有效
申请号: | 202110344587.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113076861B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 腊孟珂;王言;钟稚昉;杨仕雄;肖伟康 | 申请(专利权)人: | 南京大学环境规划设计研究院集团股份公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/25;G06V10/26;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 211505 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 鸟类 细粒度 识别 方法 | ||
本发明公开了一种基于二阶特征的鸟类细粒度识别方法,步骤包括:步骤1:采集高质量的鸟类图像数据;步骤2:对采集到的鸟类数据进行质量检测并进行数据标记;步骤3:对标记好的鸟类数据集进行数据增强;步骤4:利用开源数据集对鸟类细粒度分类模型进行预训练;步骤5:利用数据增强后的鸟类数据进行鸟类细粒度分类模型的训练;步骤6,利用摄像头采集真实野外场景下的鸟类保护区图像数据;步骤7:利用目标检测算法检测鸟类主体并利用检测框过滤图像中鸟主体以外的背景;步骤8:对鸟主体图像进行插值处理;步骤9:利用训练好的鸟类细粒度分类模型对帧图像进行鸟类的识别,输出识别结果。本发明有效提高了鸟类识别的准确率。
技术领域
本发明属于鸟类细粒度识别方法领域,更具体的,涉及一种基于二阶特征的鸟类细粒度识别方法。
背景技术
近年来,由于机器学习技术不断发展和相关计算设备的计算能力不断提高,使得在通用图像分类之后,细粒度图像分类也成为可能。对于专业领域内的图像进行精准的细粒度识别,不仅可以有效的降低相关专业人员的鉴定压力,使得该领域知识被更加广泛的利用,同时是使得机器学习技术得以落地的有效方式。
图像分类任务通常指代以ImageNet等数据集为代表的通用图像分类任务,此类任务中数据集中不同类别的图像特征差异明显,例如汽车、飞机、鸟类等,其需要使用的知识通常为人类的常规知识,而非专业领域的特点知识。与通用图像分类不同,由于拍摄角度,拍摄方式以及物体运动姿态等因素,导致细粒度图像分类任务中待分类的图像通常具有类间差异大、类内差异小的问题,使得分类难度被大大增加。例如对于北极燕鸥和福斯特燕鸥两种鸟类,其不同仅体现在鸟喙的颜色所有差异,而身体部分的难以分辨。这样就导致若普通人若缺乏相关专业领域的知识,则难以进行有效的细粒度分类任务。
为了使得细粒度识别模型具有相关专业领域的知识,研究人员在细粒度识别模型进行训练的时候,使用了具有更多专业知识的标注信息。以细粒度鸟类识别任务为例,相关研究人员进行了鸟类身体特征部分的标注,例如喙,冠,尾等鸟类关键位置的标注。这些更细节的标注使得细粒度识别模型关注待识别对象关键部分的能力得到显著的提升。但是这些依靠相关专业人员进行的数据标注成本较高,导致带有此部分标注的数据难以大规模获得,而基于深度学习的特征表示学习方法,在一定程度上可以缓解相关问题,在不需要专业标注的情况下,得到更有效的图像特征。
以Mask-CNN为代表的基于深度学习的细粒度识别模型,结合目标检测(ObjectDetection)、语义分割(Semantic Segmentation)等计算机视觉领域的基础问题相关模型,对输入图像进行分析,得到模型估计的关键位置,使得细粒度图像识别模型具有检测输入图像中相关特征部件的能力。
以结合目标检测和语义分割等相关模型对输入图像进行关键部位检测的深度学习方法,由于要为相关框架提供一些监督信息,所以依然需要使用少量标注数据。为了进一步减少模型训练过程中对标注信息的使用,相关研究人员提出了基于注意力机制(Attention)的深度学习模型用于待检测物体关键部位的自动检测,并取得了一定进展。在细粒度识别领域,基于深度学习的方法正逐渐成为主流方法。
发明内容
本发明针对现有技术中基于深度学习的细粒度识别方法存在部分缺陷,包括仍存在模型对于强监督信息的依赖问题;以及当前细粒度识别方法由于数据集限制难以实际应用的问题,提供一种结合目标检测模型和二阶特征的细粒度识别方法,该方法可以在不使用细粒度识别问题数据集中强监督标注的情况下,使得模型具有一定的鸟类细粒度识别能力;同时设计一种边缘视频检测与后端细粒度识别相分离的算法框架,使得该细粒度识别模型可能被应用到实际场景中。
为实现上述目的,本发明采用以下技术方案:一种基于二阶特征的鸟类细粒度识别方法,包括如下步骤:
步骤1,采集高质量的鸟类图像数据,组成鸟类数据集Dbri;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学环境规划设计研究院集团股份公司,未经南京大学环境规划设计研究院集团股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344587.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冰胆
- 下一篇:一种车辆雨刮控制系统及其方法