[发明专利]一种基于深度学习的人体朝向预测方法及装置有效
申请号: | 201710282729.6 | 申请日: | 2017-04-26 |
公开(公告)号: | CN107122736B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 马华东;刘武;刘培业 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人体 朝向 预测 方法 装置 | ||
1.一种基于深度学习的人体朝向预测方法,其特征在于,包括:
在对人体朝向数据库进行训练时,通过卷积神经网络和门结构的循环神经网络计算所述人体朝向数据库中每一张图片的人体朝向预测值;
计算所述人体朝向预测值与人体朝向真实值的偏差;
根据权重序列损失函数:确定所述人体朝向数据库中所有图片的整体偏差Lwei,其中,x′i=xi-max(x1,…,xn),Ln表示所述人体朝向数据库中的第n张图片的人体朝向的偏差,Wn表示权重损失函数的权重,xi表示第i张图片的空间特征;
在判断所述整体偏差Lwei大于或等于预设阈值时,重新对所述人体朝向数据库进行训练,返回所述通过卷积神经网络和门结构的循环神经网络计算所述人体朝向数据库中每一张图片的人体朝向预测值的步骤,直至所述整体偏差Lwei小于所述预设阈值;
在判断所述整体偏差Lwei小于所述预设阈值时,建立行人时空特征预测模型;
获取待检测视频对应的帧序列的每一帧中每一个行人的位置;
根据所述位置和预先建立的行人时空特征预测模型,通过卷积神经网络提取所述每一个行人的空间特征;
根据所述空间特征和所述行人时空特征预测模型,通过门结构的循环神经网络提取所述帧序列的时间特征,得到所述每一个行人的时空特征;
提取所述时空特征中的方向特征,得到所述每一个行人的人体朝向。
2.根据权利要求1所述的基于深度学习的人体朝向预测方法,其特征在于,所述根据所述空间特征和所述行人时空特征预测模型,通过门结构的循环神经网络提取所述帧序列的时间特征,得到所述每一个行人的时空特征,包括:
如果t-1时刻所述门结构的循环神经网络模型输出的时空特征为ht-1,t时刻所述门结构的循环神经网络模型输入的空间特征为xt,
根据公式:
zt=sigmoid(Wzxt+Uzht-1+bz),
rt=sigmoid(Wrxt+Urht-1+br),确定t时刻门结构的循环神经网络模型输出的时空特征ht,
其中,zt表示t时刻更新门的输出结果,rt表示t时刻重置门的输出结果,所述更新门、所述重置门和隐藏层位于所述门结构的循环神经网络模型中,表示中间变量,⊙表示向量之间的点乘,Wz表示更新门的空间特征xt的权重,Uz表示更新门的时空特征ht-1的权重,bz表示更新门的惩罚量,W表示隐藏层的空间特征xt的权重,U表示隐藏层rt和ht-1的点乘的权重,bh表示隐藏层的惩罚量,Wr表示重置门的空间特征xt的权重,Ur表示重置门的ht-1的权重,br表示重置门的惩罚量。
3.根据权利要求1所述的基于深度学习的人体朝向预测方法,其特征在于,所述获取待检测视频对应的帧序列的每一帧中每一个行人的位置,包括:
通过基于区域的全卷积网络R-FCN提取所述每一个行人的位置。
4.根据权利要求1所述的基于深度学习的人体朝向预测方法,其特征在于,所述提取所述时空特征中的方向特征,得到所述每一个行人的人体朝向,包括:
通过卷积神经网络提取所述时空特征中的方向特征,得到所述每一个行人的人体朝向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710282729.6/1.html,转载请声明来源钻瓜专利网。