[发明专利]步态视角检测方法和装置以及步态识别方法和装置在审
申请号: | 202111611136.2 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114445910A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 童心;宋宏伟;李永春;岳志强;魏宏超;蒲岩;周丹 | 申请(专利权)人: | 沈阳康泰电子科技股份有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06N3/04;G06K9/62;G06V10/82;G06V10/774;G06V10/764 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王学强;王兆赓 |
地址: | 110167 辽宁省沈阳*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 步态 视角 检测 方法 装置 以及 识别 | ||
本公开提供了一种步态视角检测方法和装置以及一种步态识别方法和装置。所述步态视角检测方法包括:获取包括待检测目标的步态图像;基于步态图像生成步态剪影;将步态剪影输入到基于卷积神经网络的视角特征提取网络以生成特征向量;以及将特征向量送入预先训练的视角分类器以将多个视角标签之中类别概率置信度最高的视角标签对应的角度确定为步态视角,其中,步态视角表示待检测目标的行走方向与步态图像的拍摄方向之间的夹角,视角分类器中包括预置的多个视角标签,与多个视角标签对应的角度为等差数列。
技术领域
本公开涉及步态识别领域,具体地,本公开提供了一种基于卷积神经网络的步态视角检测方法和装置以及一种步态识别方法和装置。
背景技术
随着多模态生物特征识别技术的快速发展,行人步态特征作为一种新的生物特征受到人们的广泛关注。在现有技术中,可以采用步态作为标识来区分不同的行人。步态特征主要用于表达人体行走过程中的姿态变化信息。较之指纹、人脸与虹膜等其它生理特征,步态具有难以伪装、容易采集与无需行人配合等优势。基于人体步态特征可以在远距离、低视频质量的环境下对行人身份进行准确的识别。
然而,在步态序列采集过程中不同的采集视角对步态序列的外观特征影响很大。例如,即使对于同一个人,从不同视角对其进行样本采集时,其步态外观的特征差异往往会比不同人之间的步态外观差异还要大。如何采取有效的方式来提取步态样本的身份特征,克服样本采集视角差异对步态识别准确率的影响,这是当前步态识别领域研究的热点问题。
发明内容
本公开提供了一种步态视角检测方法和使用该方法的装置,更具体地,提供了一种基于卷积神经网络的步态视角检测方法和使用该方法的装置。
本公开的一方面提供了一种步态视角检测方法。所述方法包括:获取包括待检测目标的步态图像;基于步态图像生成步态剪影;将步态剪影输入到基于卷积神经网络的视角特征提取网络以生成特征向量;以及将特征向量送入预先训练的视角分类器以将多个视角标签之中类别概率置信度最高的视角标签对应的角度确定为步态视角,其中,步态视角表示待检测目标的行走方向与步态图像的拍摄方向之间的夹角,视角分类器中包括预置的多个视角标签,与多个视角标签对应的角度为等差数列。
可选地,所述视角特征提取网络可以包括:输入层,将步态剪影转化为三维矩阵;第一隐含层,通过具有第一感受野的N层卷积层来对三维矩阵执行卷积计算以提取全局步态视角特征;第一池化层,通过步长为2的最大池化对第一隐含层的输出进行下采样计算以将三维矩阵的第二维和第三维减小一半;第二隐含层,通过具有第二感受野的M层卷积层来对第一池化层的输出进行卷积计算以提取局部步态视角特征;第二池化层,通过步长为2的最大池化对第二隐含层的输出进行下采样计算以将三维矩阵的第二维和第三维减小一半;第三隐含层,通过具有第三感受野的Q层卷积层来对第二池化层的输出进行卷积计算以提取步态视角边缘特征;以及第三池化层,对第三隐含层的输出进行下采样计算以将三维矩阵的第二维和第三维减为1;全连接层,对第三池化层的输出进行全连接以生成特征向量,其中,第一感受野第二感受野第三感受野,N、M、Q为正整数。
可选地,所述方法还可以包括对视角特征提取网络进行训练的步骤:准备训练数据,训练数据由与多个摄像机来采集,其中,多个视角标签对应的角度与多个摄像机一一对应,训练数据包括常规步态、有携带物步态和特殊穿戴步态中的至少一种;利用训练数据通过视角特征提取网络和视角分类器计算步态视角;利用损失函数评价视角特征提取网络的优劣,调节视角特征提取网络中各神经元之间的连接权重以反向传播优化参数,对视角特征提取网络进行迭代训练,当损失函数低于预定损失阈值、收敛或者迭代次数达到预定计数时,终止训练,其中,损失函数由下式表示:k为多个视角标签的视角类别总数,i为训练数据的序号,j为视角类别的序号,mij为软标签,nij为训练数据i属于类别j的预测概率。
可选地,第一隐含层、第二隐含层和第三隐含层可以使用修正线性单元作为激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳康泰电子科技股份有限公司,未经沈阳康泰电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111611136.2/2.html,转载请声明来源钻瓜专利网。