[发明专利]一种基于YOLOv3与SSR的行人检测算法在审
申请号: | 202010667461.X | 申请日: | 2020-07-13 |
公开(公告)号: | CN111797795A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 张翮翔;呼子宇;郝若欣;马学敏;高博;高泽航 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京专赢专利代理有限公司 11797 | 代理人: | 刘梅 |
地址: | 066004 河北省秦皇*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov3 ssr 行人 检测 算法 | ||
1.一种基于YOLOv3与SSR的行人检测算法,其特征在于,具体步骤如下:首先利用图像采集设备采集到行人的图像,网络自动提取关键帧,将彩色的关键帧进行降维处理转化灰度图像,利用TrAdaBoost生成具有一定迁移学习能力的分类器,对灰度图像的进行分类,若达到预定值,则直接传输到YOLOv3网络中进行行人检测;若未达到预定值,则传输到SSR算法进行图像处理,再传输到YOLOv3算法中进行行人检测。
2.根据权利要求1所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,YOLOv3网络是经过改进后的YOLOv3算法,改进步骤如下:A、增加算法检测尺度;B、目标框维度聚类;C、改变损失函数。
3.根据权利要求2所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,所述YOLOv3算法使用的检测网络为DarkNet-53网络,并使用3种不同比例的特征图融合,包括一个下采样特征图,尺度大小为13×13,两个上采样特征图,尺度大小分别为26×26,52×52。
4.根据权利要求3所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,步骤B具体是:选用在COCO数据集中的高宽比大于2的先验框,然后采用K-means聚类重新分析行人数据集,从而得到了适合室内行人的最优anchor个数和高宽比。
5.根据权利要求4所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,所述YOLOv3算法采用重叠度交并比的计算方法计算bounding box与真实框之间的距离,具体公式为d(box,centroid)=1-IOU(box,centroid),式中:B表示box,C表示centroid。box为样本聚类结果;centroid为所有簇的中心;IOU(box,centroid)为所有簇中心与所有聚类框的交并比。
6.根据权利要求5所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,所述YOLOV3算法采用交叉熵损失函数提升检测效果,函数的表达式定义为下式:当公式中的y的值等于1时,x的值越接近1,则损失函数的值越小;相反,x的值越接近0,则损失函数的值越大,如果公式中y的值等于0,则x的值越接近0,网络的损失函数的值越小;否则,x的值越接近1,则损失函数的值越大。
7.根据权利要求1所述的一种基于YOLOv3与SSR的行人检测算法,其特征在于,采用算法TrAdaBoost作为样本迁移学习算法,具体实施方法如下,首先计算出图像亮度平均值与对比度平均值,并标记出是否需要SSR算法进行处理,不需要处理的标记为0,需要处理的标记为1,另制作未标注的测试数据集S沿用原算法中的基本分类算法Learner,迭代次数为M,接着使用TrAdaBoost算法对样本进行迁移学习,获得最终分类器,最后,将网络融合在一起,具体方式为提取关键帧,计算出关键帧的亮度平均值与对比度平均值,输入到分类器网络中,由分类器进行分类,若该关键帧被标记为1,则需要将图像输入到SSR算法中进行图像处理,若该关键帧被TrAdaBoost算法标记为0,则直接跳过图像处理算法,直接将图像输入到YOLOv3算法进行预测,分类器的函数表达式为其中N为迭代次数,数值为ht(x)表示调用分类算法Learner。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010667461.X/1.html,转载请声明来源钻瓜专利网。