[发明专利]一种小目标检测性能优化方法在审
申请号: | 201910584768.0 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110298402A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 罗汉武;潘秀宝;张成松;胡全义;郭金刚;罗旺;席丁鼎;吴钰芃;潘富城;于晓蝶;冉清文;张全;琚小明 | 申请(专利权)人: | 国网内蒙古东部电力有限公司;南京南瑞集团公司;华东师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 010010 内蒙古自治*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小目标 检测 矩阵 上下文关系 上下文信息 基础目标 目标检测 性能优化 准确度 网络 筛选 融入 优化 | ||
本发明公开一种小目标检测性能优化方法,其特点是使用上下文关系矩阵和基于上下文的筛选方法,将上下文信息融入YOLOV3目标检测网络,结合YOLOV3优秀的基础目标检测网络,进而提升小目标检测的准确度,优化了小目标检测的性能。本发明与现有技术相比具有通过上下文关系矩阵和基于上下文的筛选,将上下文信息融入到YOLOV3目标检测网络,结合YOLOV3优秀的基础目标检测网络,进而提升小目标检测的准确度,最后提升了小目标检测的性能,使用方便,尤其在各领域的运用发挥了最大的经济效益。
技术领域
本发明涉及计算机视觉算法技术领域,尤其是一种小目标检测性能优化方法。
背景技术
小目标检测是目标检测领域一个公开的挑战,同时具有很多现实中应用的需求,比如无人机巡航,智能监控,机器人巡检等等。近年来,随着深度学习应用在目标检测领域,目标检测技术开始飞速发展,作为目标检测的一个子问题,越来越多的研究开始关注如何解决小目标检测的问题。由于小目标存在低分辨率,语义信息弱,与背景差异大等问题,造成现有主流的目标检测框架如Faster R-CNN、YOLO,SSD等无法满足小目标检测的精度要求。最近相关的研究主要集中在两个方面,一方面针对小目标本身包含特征少,通过卷积神经网络提取特征后,语义信息容易丢失的问题,很多学者提出图像超分辨率,多尺度融合特征,多网络级联等方式减少小目标的信息丢失。另一方面也有学者提出,由于小目标本身的特征表达能力弱,可以使用周围上下文信息帮助增加小目标识别的精度。然而,尽管研究表明,上下文信息有助于小目标的识别,但大部分的算法并没有明确使用上下文信息,比如特征金字塔(FPN)结构,通过多尺度融合的方式,在得到多层特征图的基础上采用top-down的方式对小特征图上采样后与下一个特征进行融合之后再进行预测,以此将顶层的语义信息与底层的位置信息结合来提高目标检测的准确性。这些方法虽然在一定程度上提高了小目标检测精度,但小目标检测的性能仍然有较大提升空间。
发明内容
本发明的目的是针对现有技术的不足而设计的一种小目标检测性能优化方法,采用上下文关系矩阵和基于上下文的筛选方法,将上下文信息融入 YOLOV3目标检测网络,结合YOLOV3优秀的基础目标检测网络,进而提升小目标检测的准确度,优化了小目标检测的性能。通过统计图像位置的相对关系,引入空间上下文信息,以及采用基于上下文的筛选算法代替通用的非极大抑制算法进行候选框的选择,实现了更为细粒度的小目标检测。方法实施简单,使用方便,进一步提高小目标检测的精度和速度。
本发明的目的是这样实现的:一种小目标检测性能优化方法,其特点是使用上下文关系矩阵和基于上下文的筛选方法,将上下文信息融入YOLOV3 目标检测网络,结合YOLOV3优秀的基础目标检测网络,进而提升小目标检测的准确度,优化了小目标检测的性能,其具体优化包括下述步骤:
a、各参数的定义
在构建上下文关系前,先定义训练图片数为n,标注信息为M[n],每张图片存在的目标数为object[n],训练的目标种类K,相关度阈值μ,相关性影响参数p,并定义引入的上下文关系矩阵为CRM,用以表示视觉感知下已知一对目标的相关程度。
b、训练目标检测网络
依次输入训练图片数,标注信息,每张图片存在目标数object[n],训练的目标种类数K,相关度阈值μ,相关性影响参数p,然后循环训练提取输出上下文关系矩阵CRM,具体包括下述方法:
⑴、首先初始化任意对象i和对象j的上下文关系矩阵值为CRM[i][j]=0,使用输入信息循环计算任意对象i,j的上下文关系取值,并针对输入的每张图片信息,从输入的标注信息读取该图像的标注信息,获取该图片各个目标对象的中心坐标,对于任意对象i和j,若i和j的中心坐标的距离小于相关度阈值μ,相应CRM[i][j]加1,对每张图像的所有对象执行相同操作,直到所有图片处理完成,完成初始的上下文关系矩阵CRM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网内蒙古东部电力有限公司;南京南瑞集团公司;华东师范大学,未经国网内蒙古东部电力有限公司;南京南瑞集团公司;华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910584768.0/2.html,转载请声明来源钻瓜专利网。