[发明专利]基于改进自顶向下法多人姿态检测的行人运动预测方法有效
申请号: | 201910921085.X | 申请日: | 2019-09-27 |
公开(公告)号: | CN110751056B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 张子蓬;刘逸凡;李昌平;庆毅辉;周博文;马烨;王晨曦;兰天泽;王淑青 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/82;G06N3/0442;G06N3/0464 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 下法 姿态 检测 行人 运动 预测 方法 | ||
1.一种基于改进自顶向下法多人姿态检测的行人运动预测方法,其特征在于,包括以下步骤:
步骤1:输入原始多人行人视频;
步骤2:对输入视频进行行人边界框SSD处理,得到行人边界框b;
步骤3:对步骤2中获得的行人边界框b进行空间网络变换,提取出一个高质量的人体区域框;
步骤4:对每一个高质量人体区域框进行单人姿势检测,得到有冗杂的骨点置信度E;
对每一个高质量人体区域框采用CNN单人姿势检测SPPE得到有冗杂的骨点置信度E;
其中,dj1、dj2分别为两个骨点的位置,Lc为两骨点组成的线段,u为计算积分的中间系数,且u∈[0,1],p(u)为dj1、dj2之间的插值,其计算方法为:
p(u)=(1-u)dj1+udj2;
步骤5:对有冗杂的骨点置信度E,进行消除冗杂处理;
步骤6:将步骤3中获得的人体区域框映射至原图坐标中,得到原图坐标中的高质量区域框;
步骤7:将当前帧与前N帧进行步骤1-6的处理,分别得到N+1张图片的骨点置信度E(di),i=1,2,...,N+1,对这N+1张骨点图画出每张骨点的运动轨迹;
步骤8:对这N+1张图片进行光流处理,得到各个骨点的位移向量ε(d);
步骤9:将每一帧的骨点dj以及预计下一帧的新骨点v连接,得到人体骨骼框图;
步骤10:将步骤7中获得的N+1个连续帧E(di)和步骤8的光流处理后的骨点位移偏移量ε(d)传输到长短期记忆神经网络LSTM进行训练模型;
步骤11:步骤10中每进行M次训练则生成一次骨骼框图Ef,所述Ef即为实时的行人运动预测。
2.根据权利要求1所述的基于改进自顶向下法多人姿态检测的行人运动预测方法,其特征在于,步骤2的具体实现过程是:
假设得到行人边界框为b,则:
b=(bcx,bcy,bw,bh)=(dwlcx+dcx,dhlcy+dcy,dwexp(lw),dhexp(lh))
且
其中,d表示先验框的位置,l表示边界框的预测位置,icx,icy分别表示边界框i中心的横坐标和纵坐标,iw,ih分别表示边界框i的宽和高,i可取b、d、l。
3.根据权利要求2所述的基于改进自顶向下法多人姿态检测的行人运动预测方法,其特征在于,步骤3的具体实现过程是:采用空间变换网络STN对行人边界框b提取出一个高质量的人体区域框
其中,θ1,θ2,θ3均为反映人体区域框变换前后坐标关系的向量系数,为空间变换网络STN变换之后的区域框坐标。
4.根据权利要求1所述的基于改进自顶向下法多人姿态检测的行人运动预测方法,其特征在于,步骤5的具体实现过程是:选取最大置信度的骨点Emax作为参考,定义η为标准的阈值,则:
若E(di,dj)输出为1,则表示骨点di是冗杂的,应被消除;若E(di,dj)输出为0,则表示骨点dj是冗杂的,应被消除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910921085.X/1.html,转载请声明来源钻瓜专利网。