[发明专利]一种基于人体姿态分析的表观视线估计方法在审
申请号: | 201910599803.6 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110795982A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 王轩;漆舒汉;尹李明;蒋琳;廖清;刘洋;夏文;李化乐;易正中;李逸凡 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 44451 深圳市添源知识产权代理事务所(普通合伙) | 代理人: | 黎健任 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人体姿态 视线方向 注视点 视线 卷积神经网络 人体姿态信息 头部中心位置 准确度 目标检测 视线估计 头部姿态 鲁棒性 特征图 通过点 连线 算法 估算 预测 | ||
1.一种基于人体姿态分析的表观视线估计方法,该视线估计方法的网络结构由三个分支组成,显著图分支、头部姿态分支和人体姿态分支,该方法包括以下步骤:
显著图分支由整幅图像xf作为输入,其维度经放缩后变为3×H×W,图像经一个主干网络提取特征,特征图的维度是K×D×D,然后接一个卷积核大小是1×1的卷积层,将其通道数变为1,得到的显著图的维度是1×D×D;
头部姿态分支:头部姿态分支由头部图像xh和头部位置矩阵xhl作为输入,头部中心位置hc和大小hl使用人体骨骼关键点检测中的头顶位置ph和颈部位置pn计算得到,先经过一个主干网络提取特征,然后接一个卷积核大小为1×1的卷积层,最后得到维度为1×D×D的特征图;
人体姿态分支:人的图像和人体骨骼关键点位置矩阵作为输入;堆叠多个hourglass模块,图像的大小先放缩到256×256,然后经过一个卷积核大小为7×7,步长为2卷积层和一个池化大小为2×2的最大池化层进行初步的特征提取后,得到大小为64×64,通道数为256的特征图后,进入hourglass模块;在hourglass模块之间使用卷积层进行连接;单个hourglass模块由卷积层和最大池化层进行下采样特征图到一定的大小;经卷积层和最近邻上采样特征图到原来的大小组成;卷积层后会使用组归一化对同组内的像素进行归一化,即对每一个像素点xi转化网络最后的输出经2个卷积核大小1×1的卷积层后,将通道数变为关键点的个数;
三个分支的特征图进行点乘,接上主干网络的分类部分,即最后的全连接层,得到最后的输出y,作为注视点位置的预测输出;
最终使用注视物体的中心位置与头部的中心位置的连线作为视线方向。
2.根据权利要求1所述的方法,其特征在于,上述组归一化计算方法如下:
其中,xi为输入,μi,σi为归一化数据服从的分布的均值和方差,为经过归一化的输出,γ,β为网络学习到的均值以及方差参数,ε是为了避免出现除0的情况所添加的一个很小的数,Si即参与计算均值与方差的像素点集,m为Si集合的大小,C为当前特征图的通道大小,G为Group设置的大小,kn,kc,in,ic表示Si点集中的一个元素。
3.根据权利要求2所述的方法,其特征在于,头部中心位置hc和大小hl的计算公式为:
hl=||ph-pn||2。
4.根据权利要求1所述的方法,其特征在于,头部位置矩阵xhl是一个大小为DxD的矩阵,其元素全为0,只在对应量化后的头部中心位置hc的元素为1,hx、hy为头部中心在图片中的位置,即
5.根据权利要求1-4任一项所述的方法,其特征在于:
其中,F代表全连接操作,S代表显著图分支,H代表头部姿态分支,P代表人体姿态分支。xf为输入的整张图片,xh为头部图片,xhl为头部定位,xb为人体定位图片,xbl为关键点定位图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910599803.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高压氧舱人脸识别交互方法及系统
- 下一篇:显示设备及其指纹管理方法