[发明专利]一种动作识别方法及装置有效
申请号: | 201811604771.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109800659B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 张一帆 | 申请(专利权)人: | 中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孟德栋 |
地址: | 211135 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 动作 识别 方法 装置 | ||
本发明提出了一种动作识别方法及装置,包括:获取视频中待识别对象在运动时的骨骼数据;根据所述骨骼数据生成所述待识别对象的骨骼序列;生成与所述骨骼序列对应的骨骼特征图像,所述骨骼特征图像中包括若干个骨骼点;将骨骼特征图像输入至预设卷积神经网络模型进行分类,得到与所述骨骼特征图对应的动作类别。本发明将动作识别的问题转化成骨骼序列图像分类的问题,将骨骼序列转换为骨骼特征图像,然后再对骨骼特征图像分类,使得识别更加准确,效率更高。
技术领域
本发明涉及识别领域,具体涉及一种动作识别方法及装置。
背景技术
人类动作识别有着多种模态,例如外观、深度、光流和身体骨骼等。在这些模态当中,动态人类骨骼通常能与其他模态相辅相成,传达重要信息。因此,可以通过骨骼序列来进行人体动作识别。
然而现有的骨骼进行动作识别的方法是将骨骼点的坐标直接串联为一个一维长向量,并对其进行时序分析,这种识别方法的准确率低。
因此本发明提供一种动作识别方法及装置来解决现有技术的不足。
发明内容
本发明旨在提供一种动作识别方法及装置,解决目前骨骼序列的动作类别识别不准确的问题。
根据本发明一方面,其提供了一种动作识别方法,包括:
获取视频中待识别对象在运动时的骨骼数据;
根据所述骨骼数据生成所述待识别对象的骨骼序列;
生成与所述骨骼序列对应的骨骼特征图像,所述骨骼特征图像中包括若干个骨骼点;
将骨骼特征图像输入至预设卷积神经网络模型进行分类,得到与所述骨骼特征图对应的动作类别。
进一步的,生成与所述骨骼序列对应的骨骼特征图像,包括:
将视频中每帧图像中骨骼序列的三维点坐标按照预设顺序排列为三通道数据;
将所述三通道数据按时间顺序排列为三通道矩阵;
将所述三通道矩阵进行归一化处理,得到骨骼特征图像。
进一步的,将所述三通道矩阵进行归一化处理,得到骨骼特征图像,包括:
所述归一化如下式所示:
其中,为骨骼特征图像第c个通道上位置坐标(i,j)处的像素值;和分别为骨骼特征图像第c个通道上像素的最小值和最大值;round(.)为取整函数。
进一步的,将骨骼特征图像输入至预设卷积神经网络模型进行分类,得到与所述骨骼特征图对应的动作类别,包括:
利用预设卷积神经网络模型提取所述骨骼特征图像的特征;
利用全连接层将所述特征转换为特征向量;
根据所述特征向量确定所述骨骼特征图像的类型,所述类型为所述待识别对象的动作类别。
根据本发明另一方面,其公开了一种动作识别装置,包括:
获取模块,用于获取视频中待识别对象在运动时的骨骼数据;
生成模块,用于根据所述骨骼数据生成所述待识别对象的骨骼序列;
特征图像模块,用于生成与所述骨骼序列对应的骨骼特征图像,所述骨骼特征图像中包括若干个骨骼点;
确定模块,用于将骨骼特征图像输入至预设卷积神经网络模型进行分类,得到与所述骨骼特征图对应的动作类别。
进一步的,所述特征图像模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所,未经中国科学院自动化研究所南京人工智能芯片创新研究院;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811604771.6/2.html,转载请声明来源钻瓜专利网。