[发明专利]基于深度学习和多层次图结构模型的人体姿态估计方法有效
申请号: | 201810476203.6 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108647663B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 何立火;戴慧冰;高新波;邢志伟;钟炎喆;路文;郭兆骐 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 多层次 结构 模型 人体 姿态 估计 方法 | ||
1.一种基于深度学习和多层次图结构模型的人体姿态估计方法,其特征在于:包括如下步骤:
(1)将传统的人体部件类型重新进行定义,即把人体部件分为组合部件和关节点两种类型;
(2)利用由5层卷积层、2层下采样层和3层全连接层组成的卷积神经网络,对(1)中重新定义的人体部件进行分类和定位,并输出人体各部件的候选坐标:
2a)根据步骤(1)中定义的人体部件类型以及公开数据库中现成的人体各个部件的位置坐标,将包含人体的自然图像裁剪成包含各个人体部件的图像块和包含背景的图像块,作为2c)中卷积神经网络的输入;
2b)建立关于所有人体部件的状态空间S,通过所有人体部件的状态空间S为每个人体部件定义一个全局ID号;
2c)根据2b)所有人体部件的状态空间S以及公开数据库中现成的人体各个部件的位置坐标,对2a)裁剪得到的图像块进行标注,其标注信息包括部件类型、部件的位置坐标以及2b)中的全局ID号;
2d)将2c)带有标注信息的图像块作为卷积神经网络的输入,对该卷积神经网络进行训练,得到训练好的卷积神经网络;
2e)将整幅包含人体的自然图像输入到2d)训练好的卷积神经网络中,对人体各部件以及背景像素进行分类和定位,输出整幅自然图像中人体各部件的候选坐标;
(3)设计多层次图结构模型,其中,第一层,将整个人体作为根节点;第二层,将整个人体分解为三个大的组合部件,第三层,将三个大的组合部件继续分解为小的组合部件;第四层,将小的组合部件分解为其所对应的关节点;
(4)对每一个人体部件,利用(3)设计的多层次图结构模型,计算(2)中卷积神经网络输出的候选坐标属于人体部件最终坐标的所有概率,从中选取该部件的最高概率,将最高概率对应的候选坐标取做该部件的最终坐标,并输出。
2.根据权利要求1所述的方法,其特征在于步骤2b)中建立关于所有人体部件的状态空间S,按如下步骤进行:
2b1)建立一类人体部件的状态空间:
令N表示人体部件的类型个数,c表示输入的图像块中包含的人体部件,j表示第一个与人体部件c直接相连的人体部件,k表示第二个与人体部件c直接相连的人体部件,且c,j,k∈{0,1,…,N},Pcj表示c与j的连接类型个数,Pck表示c与k的连接类型个数,Mc表示人体部件c对应的状态空间,其取值根据人体部件c在整个人体中所属的节点类型确定:
当人体部件c是叶子节点,且仅与第一个部件j有直接的连接关系时,则状态空间Mc={1,…,Pcj};
当人体部件c是中间节点,且同时与第一个部件j、第二个部件k都有直接的连接关系时,则状态空间Mc={1,…,Pcj}×{1,…,Pck};
2b2)根据2b1)得到所有人体部件的状态空间S:
其中,表示人体部件c从0到N取遍所有的人体部件类型的集合。
3.根据权利要求1所述的方法,其特征在于步骤(3)中设计多层次图结构模型,包括如下4层:
第一层,将整个人体作为根节点;
第二层,将整个人体分解为三个大的组合部件,即左半身、右半身、腿;
第三层,将三个大的组合部件继续分解为小的组合部件,即左半身分解为头部和左手臂,右半身分解为头部和右手臂,腿分解为左腿和右腿;
第四层,将小的组合部件进一步分解为其所对应的关节点,即头部分解为头顶和脖子,左手臂分解为左肩、左手肘和左手腕,右手臂分解为右肩、右手肘和右手腕,左腿分解为左臀、左膝和左脚踝,右腿分解为右臀、右膝和右脚踝。
4.根据权利要求1所述的方法,其特征在于步骤(4)中利用多层次图结构模型,计算(2)中卷积神经网络输出的候选坐标属于人体部件最终坐标的所有概率,按如下步骤进行:
4a)利用多层次图结构模型,定义求解人体部件最终坐标的分数函数如下:
F(l,t|I)=∑U(lc|I)+∑R(lc,lj,tcj|I)
其中,l是由卷积神经网络输出的人体各部件的候选坐标,t是人体各部件可能出现的所有连接类型,I是一幅包含人体的自然场景图像,U(·)是多层次图结构模型中的似然度观测项,lc是由卷积神经网络输出人体部件c的候选坐标,R(·)是多层次图结构模型中的结构先验项,lj是由卷积神经网络输出人体部件j的候选坐标,tcj是人体部件c与人体部件j的连接类型;
4b)以l,t为自变量,求解分数函数F(l,t|I)的最大值,得到卷积神经网络输出的人体各部件的候选坐标对应的分数;
4c)将人体各部件的候选坐标对应的分数归一化为分数概率,即计算出卷积神经网络输出的候选坐标属于人体部件最终坐标的所有概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810476203.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动检测人脸的方法及系统
- 下一篇:一种基于环视图像的车道线检测方法