[发明专利]一种行人检测方法在审
申请号: | 201910086310.2 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109948432A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 潘钰华 | 申请(专利权)人: | 江苏裕兰信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 宁波象山甬恒专利代理事务所(普通合伙) 33270 | 代理人: | 顾赛喜 |
地址: | 江苏省扬州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 双腿 目标窗口 检测 图像金字塔 滑动窗口 图像构造 组合策略 负样本 正样本 截取 送入 尺度 图像 分类 | ||
1.一种行人检测方法,其特征在于,包括步骤:
S100训练SVM分类器,以人头和双腿为正样本,以行人背景作为负样本,训练两个SVM分类器;
S200将待检测的图像构造图像金字塔;
S300滑动窗口,在图像金字塔的各个尺度上截取目标窗口;
S400对目标窗口提取HOG特征;
S500将S400中提取的HOG特征送入SVM分类器中,分类判断目标窗口是行人的头部、行人的双腿或行人背景;
S600根据S500中检测到的头部和双腿结果来组合行人,判断待检图像中是否含有行人。
2.根据权利要求1所述的行人检测方法,其特征在于,所述步骤S200具体包括步骤:对图像进行下采样或上采样,降低图像的分辨率,识别不同尺度的目标,其中,金字塔的底部是待处理图像的高分辨率表示,顶部是低分辨率的近似。
3.根据权利要求1所述的行人检测方法,其特征在于,所述步骤S500具体包括步骤:将提取的HOG特征送入训练的两个SVM分类器,其中一个SVM分类器负责判断是否是行人的头部,如果是则终止判别并记录下坐标值,如果不是则送入下一个SVM分类器,判断是否是行人的双腿,如果是记录下坐标值,两个都不是则判断为行人背景。
4.根据权利要求2所述的行人检测方法,其特征在于,所述步骤S500具体包括步骤:将提取的HOG特征送入训练的两个SVM分类器,其中一个SVM分类器负责判断是否是行人的头部,如果是则终止判别并记录下坐标值,如果不是则送入下一个SVM分类器,判断是否是行人的双腿,如果是记录下坐标值,两个都不是则判断为行人背景。
5.根据权利要求1~4中任一所述的行人检测方法,其特征在于,所述步骤S100中的训练SVM分类器包括步骤:
S110截取正样本,正样本是在行人正样本的基础上裁剪出行人的头部;
S120再裁剪出行人的双腿,采集的双腿要求站立,为基本垂直的双腿;
S130训练出两个SVM分类器,其中一个SVM分类器识别是否是行人头部,另一个SVM分类器识别是否是行人的双腿。
6.根据权利要求5所述的行人检测方法,其特征在于,所述步骤S600将检测到的行人头部和双腿进行组合,通过非极大值抑制的方法,选出最优框,其中,所述非极大值抑制的过程是一个迭代-遍历-消除的过程,其包括步骤:
S610将所有框的得分排序,选中最高分及其对应的框;
S620遍历其余的框,如果和当前最高分框的重叠面积大于一定阈值,将此框删除;
S630从未处理的框中继续选一个得分最高的,重复上述过程。
7.根据权利要求6所述的行人检测方法,其特征在于,所述步骤S100中的SVM设置参数如下:
svm->setType(cv::ml::SVM::Types::C_SVC);//选择opencv的C类支持向量机,n类分组(n\geq 2),允许用异常值惩罚因子C进行不完全分类;
svm->setKernel(cv::ml::SVM::KernelTypes::POLY);//采用多项式核函数,opencv中定义的多项式和函数为:K(x,y)=(gamma x^T y+coef0)^degree;
svm->setDegree(10.0);//设置多项式核函数的degree为10;
svm->setGamma(0.09);//设置多项式核函数的gamma为0.09;
svm->setCoef0(1.0);//设置多项式核函数的coef0为1;
svm->setC(10.0);//设置的错误代价参数C为10。
8.根据权利要求7所述的行人检测方法,其特征在于,所述步骤S400中的HOG特征提取算法的实现过程,包括步骤:
S410灰度化;
S420采用Gamma校正法对输入图像进行颜色空间的标准化;
S430计算图像每个像素的梯度,包括大小和方向;
S440将图像划分成小细胞单元;
S450统计每个细胞单元的梯度直方图,形成每个细胞单元的描述符;
S460将每几个细胞单元组成一个区间,一个区间内所有细胞单元的特征描述符串联起来便得到所述区间的HOG特征描述符;
S470将图像内的所有区间的HOG特征描述符串联起来得到所述图像的HOG特征描述符,这个就是最终的可供分类使用的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏裕兰信息科技有限公司,未经江苏裕兰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910086310.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种儿童心理健康报告结局评价系统
- 下一篇:一种嵌入式人脸跟踪方法及装置