[发明专利]一种基于人体姿态分析的表观视线估计方法在审

申请号：	201910599803.6	申请日：	2019-07-04
公开（公告）号：	CN110795982A	公开（公告）日：	2020-02-14
发明（设计）人：	王轩;漆舒汉;尹李明;蒋琳;廖清;刘洋;夏文;李化乐;易正中;李逸凡	申请（专利权）人：	哈尔滨工业大学(深圳)
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司：	44451 深圳市添源知识产权代理事务所(普通合伙)	代理人：	黎健任
地址：	518000 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	人体姿态视线方向注视点视线卷积神经网络人体姿态信息头部中心位置准确度目标检测视线估计头部姿态鲁棒性特征图通过点连线算法估算预测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于人体姿态分析的表观视线估计方法，该视线估计方法的网络结构由三个分支组成，显著图分支、头部姿态分支和人体姿态分支，该方法包括以下步骤：

显著图分支由整幅图像x_f作为输入，其维度经放缩后变为3×H×W，图像经一个主干网络提取特征，特征图的维度是K×D×D，然后接一个卷积核大小是1×1的卷积层，将其通道数变为1，得到的显著图的维度是1×D×D；

头部姿态分支：头部姿态分支由头部图像x_h和头部位置矩阵x_hl作为输入，头部中心位置h_c和大小h_l使用人体骨骼关键点检测中的头顶位置ph和颈部位置pn计算得到,先经过一个主干网络提取特征，然后接一个卷积核大小为1×1的卷积层，最后得到维度为1×D×D的特征图；

人体姿态分支：人的图像和人体骨骼关键点位置矩阵作为输入；堆叠多个hourglass模块，图像的大小先放缩到256×256，然后经过一个卷积核大小为7×7，步长为2卷积层和一个池化大小为2×2的最大池化层进行初步的特征提取后，得到大小为64×64，通道数为256的特征图后，进入hourglass模块；在hourglass模块之间使用卷积层进行连接；单个hourglass模块由卷积层和最大池化层进行下采样特征图到一定的大小；经卷积层和最近邻上采样特征图到原来的大小组成；卷积层后会使用组归一化对同组内的像素进行归一化，即对每一个像素点x_i转化网络最后的输出经2个卷积核大小1×1的卷积层后，将通道数变为关键点的个数；

三个分支的特征图进行点乘，接上主干网络的分类部分，即最后的全连接层，得到最后的输出y，作为注视点位置的预测输出；

最终使用注视物体的中心位置与头部的中心位置的连线作为视线方向。

2.根据权利要求1所述的方法，其特征在于，上述组归一化计算方法如下：

其中，x_i为输入，μ_i，σ_i为归一化数据服从的分布的均值和方差，为经过归一化的输出，γ，β为网络学习到的均值以及方差参数，ε是为了避免出现除0的情况所添加的一个很小的数，S_i即参与计算均值与方差的像素点集，m为S_i集合的大小，C为当前特征图的通道大小，G为Group设置的大小，k_n，k_c，i_n，i_c表示S_i点集中的一个元素。

3.根据权利要求2所述的方法，其特征在于，头部中心位置hc和大小hl的计算公式为：

h_l＝||p_h-p_n||₂。

4.根据权利要求1所述的方法，其特征在于，头部位置矩阵x_hl是一个大小为DxD的矩阵，其元素全为0，只在对应量化后的头部中心位置h_c的元素为1，h_x、h_y为头部中心在图片中的位置，即

5.根据权利要求1-4任一项所述的方法，其特征在于：

其中，F代表全连接操作，S代表显著图分支，H代表头部姿态分支，P代表人体姿态分支。x_f为输入的整张图片，x_h为头部图片，x_hl为头部定位，x_b为人体定位图片，x_bl为关键点定位图片。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)，未经哈尔滨工业大学(深圳)许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910599803.6/1.html，转载请声明来源钻瓜专利网。