[发明专利]行人检测方法、系统、计算机设备及计算机可存储介质在审
申请号: | 201910031726.4 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109902556A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 贾雪丽;程宁;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 林彦之 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 行人检测 输出 检测 计算机设备 条件类别 图片输入 可存储 特征图 小物体 预测 池化 预设 计算机 概率 图片 | ||
1.一种基于YOLO神经网络的行人检测方法,其特征在于,所述方法包括:
将待检测图片输入到所述YOLO神经网络,所述YOLO神经网络包括主线和支线,所述主线包括依顺序耦合的N个卷积层,所述N个卷积层之间配置有M个池化层,第M-1个池化层还耦合所述支线,所述支线包括依序耦合的第M+1个池化层和第N+1个卷积层;
通过所述YOLO神经网络对所述待检测图片执行卷积操作和池化操作,以得到2A个x*y卷积特征图,所述2A个x*y卷积特征图包括所述第N个卷积层输出A个x*y卷积特征图以及所述第N+1个卷积层输出A个x*y卷积特征图;
通过预设的B个行人预测框在所述2A个x*y卷积特征图上做卷积操作,输出x*y*B*(5+C)的输出张量,C表示C个条件类别概率;及
根据所述输出张量获取所述待检测图片中的行人及行人所在位置。
2.根据权利要求1所述的行人检测方法,其特征在于,将待检测图片输入到所述YOLO神经网络的步骤之前,还包括:
配置所述YOLO神经网络;
其中,所述主线包括依顺序耦合的第一组卷积层、第一池化层、第二组卷积层、第二池化层、第三组卷积层、第三池化层、第四组卷积层、第四池化层、第五组卷积层、第五池化层、第六组卷积层,所述第四池化层之后还耦合有所述支线,所述支线包括依序耦合的第六池化层和第七组卷积层,其中,依序耦合的所述第五组卷积层、第五池化层和第六组卷积层与依序耦合的第六池化层和第七组卷积层之间为并联关系。
3.根据权利要求2所述的行人检测方法,其特征在于,通过预设的B个行人预测框在所述2A个x*y卷积特征图上做卷积操作,输出x*y*B*(5+C)的输出张量的步骤,包括:
为所述2A个x*y卷积特征图中的每个网格配置B个行人预测框,获取每个网格上对应的B个行人预测框的(5+C)的向量;
其中,“5”表示单个网格对应其中一个行人预测框所预测得到的4个坐标值(tx、ty、tw、th)和1个置信度to,to表示该单个网格对应的行人预测框中是否存在物体,C表示该单个网格对应的行人类别的条件类别概率。
4.根据权利要求3所述的行人检测方法,其特征在于,根据所述输出张量获取所述待检测图片中的行人及行人所在位置的步骤,包括:
根据每个网格上对应的B个行人预测框的(5+C)的向量,预测每个网格上对应的B个边界框的边界框数据,所述边界框数据包括每个边界框在所述待检测图片中的位置、尺寸和行人类别的行人类别概率;其中,预测每个网格上对应的B个边界框的边界框数据的计算公式包括:
bx=σ(tx)+cx
by=σ(ty)+cy
其中,σ为sigmoid函数;tx:预测边界框中心点距所在网格左边的距离;ty:预测边界框中心点距所在网格上边的距离;cx、cy为该网格距离所述待检测图片左上角的位置偏移,每个网格的长和宽为1;pw、ph为行人预测框的宽度和长度;tw:预测边界框的宽度,除以所述待检测图片宽度归一化后的值;th:预测边界框的高度,除以所述待检测图片高度归一化后的值;Pr(object):行人类别的条件类别概率;为边界框和实际边界框的交并比,所述交并比为交集部分面积和并集部分面积之比;bx、by为边界框的坐标信息;bw、bh为边界框的尺寸信息;σ(to)为边界框对行人类别的行人类别概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910031726.4/1.html,转载请声明来源钻瓜专利网。