[发明专利]基于级联卷积网络的小尺度行人检测识别方法在审
申请号: | 201910120676.7 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109919045A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 刘艳霞;张姗 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小尺度 行人检测 正样本 级联 行人识别 卷积 采集 卷积神经网络 标记样本 尺度变化 复杂环境 聚类结果 任务学习 随机选择 大尺度 识别率 训练集 检测 样本 架构 网络 联合 | ||
1.基于级联卷积网络的小尺度行人检测识别方法,其特征在于步骤如下:
一.anchors聚类
因为Caltech训练数据集中存在行人遮挡面积超过50%,高度小于30像素或者宽度小于15像素的行人,首先过滤掉上述情况的样本标记,对筛选后的Caltech训练数据集标注样本进行IOU聚类;通过聚类结果,选择出Caltech Dataset的anchors;
二.样本采集
通过上一步anchors聚类选择出anchors,在Caltech Dataset标记图片中的标记位置上随机选择级联网络输入比例的样本大小分别为24x12,48x24,96x48;包括负样本、正样本、部分行人样本,并生成其label信息;
三.训练行人检测的级联网络
级联卷积网络结构,包括Rough Network,即R-Net为生成候选框的网络,Considerate-Net,即C-Net为筛选候选框的网络,Verify-Net,即V-Net为确认最后检测结果的网络;三个网络输入大小设计为:24x12,48x24,96x48;
分别用采集到24x12,48x24,96x48不同比例的样本训练R-Net,C-Net,V-Net三个网络;
四.测试行人检测的级联网络
对给定待检测图像,首先将其调整到不同的比例,构建图像金字塔;输入全卷积网络R-Net,用于获取行人的候选窗口及其边界框的回归向量;并在候选边界框的回归向量基础上进行校准,再利用非最大抑制NMS进行候选框过滤;
对上述所有候选框都输入到C-Net,进一步过滤掉大量错误的候选框,并校准边界框的回归向量进行NMS;使用V-Net进一步识别目标区域,并输出最后的识别概率和回归向量。
2.根据权利要求1所述的方法,其特征在于anchors聚类具体步骤如下:
(1)首先在Caltech Dataset上对标注样本进行筛选,过滤掉在训练中高度小于30或者宽度小于15像素的标记框和行人遮挡面积超过50%的标记框;
(2)在筛选后的Caltech数据集标记样本中,借鉴YOLO9000中的anchors聚类思想,对筛选后的Caltech训练数据集标注样本进行IOU聚类;
(3)使用KMEANS++方式选择初始聚类中心,利用簇中样本尺寸的中位数更新聚类中心;
(4)通过anchors聚类结果,选择出Caltech Dataset的anchors,在anchors大小范围内随机选择网络输入比例的正样本大小,获取正样本训练集。
3.根据权利要求1所述的方法,其特征在于样本采集具体步骤如下:
(1)基于聚类结果anchors大小,在Caltech Dataset标记图片中的标记位置上随机选择24x12,48x24,96x4的样本;
(2)负样本:与图片中每一个真实标记的行人框IOU都小于0.3的区域;正样本:与图片中任意一个真实标记的行人框IOU高于0.65的区域;部分行人:与图片中任意一个真实标记的行人框IOU在0.4和0.65之间的区域;
(3)记录不同样本的label信息为txt:将正样本标记为1,负样本标记为0,且记录正样本和部分行人样本中目标相对于整张图片的位置信息;
(4)负样本即非行人和正样本即行人用于行人识别任务,正样本和部分行人用于边界框回归;总训练数据由非行人/行人/部分行人数据组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910120676.7/1.html,转载请声明来源钻瓜专利网。