[发明专利]动作识别方法、装置、计算机存储介质和计算机设备有效
申请号: | 201911143008.2 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110866509B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 罗栋豪;王亚彪;郭晨阳;邓博元;汪铖杰;李季檩;黄飞跃;吴永坚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N3/0464 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作 识别 方法 装置 计算机 存储 介质 设备 | ||
本申请涉及一种动作识别方法、装置、计算机可读存储介质和计算机设备,该方法通过多通道卷积层获取各时序帧的图像数据在不同卷积通道上的原始子特征图;分别以各个时序帧作为目标时序帧,根据目标时序帧在各卷积通道上的原始子特征图,以及后一时序帧在各卷积通道上的原始子特征图,计算目标时序帧在各卷积通道上的运动信息权重,并根据运动信息权重获取目标时序帧在各卷积通道上的运动信息特征图;对目标时序帧在各卷积通道上的运动信息特征图进行时序卷积,得到目标时序帧在各卷积通道上的时序运动特征图;根据目标时序帧在各卷积通道的时序运动特征图获取目标时序帧的图像数据中运动对象的动作类型,本申请提供的方案可有效提高动作识别精度。
技术领域
本申请涉及图像处理技术领域,特别是涉及一种动作识别方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着计算机技术的发展,动作识别技术从图像领域扩展到了视频领域。现有技术中,对视频数据进行动作识别,一般是使用二维卷积网络神经网络对视频数据中的每一帧图像进行识别,最终对该视频数据的所有帧的动作识别结果进行一个融合得到对视频数据的动作识别结果,但是在强调运动对象动作变化的场景中,即使打乱视频数据中各帧图像的顺序,并不会影响二维卷积网络神经网络对视频数据中动作类型的识别结果,二维卷积神经网络进行动作识别的精度低。
发明内容
基于此,有必要针对传统的二维卷积神经网络进行动作识别精度低的技术问题,提供一种动作识别方法、装置、计算机可读存储介质和计算机设备。
一种动作识别方法,包括:
获取视频数据在不同时序帧的图像数据,通过多通道卷积层获取各时序帧的图像数据在不同卷积通道上的原始子特征图;
分别以各个时序帧作为目标时序帧,根据目标时序帧在各卷积通道上的原始子特征图,以及与目标时序帧相邻的后一时序帧在各卷积通道上的原始子特征图,计算目标时序帧在各卷积通道上的运动信息权重;
根据目标时序帧在各卷积通道上的运动信息权重以及目标时序帧在各卷积通道上的原始子特征图,获取目标时序帧在各卷积通道上的运动信息特征图;
对目标时序帧在各卷积通道上的运动信息特征图进行时序卷积,得到目标时序帧在各卷积通道上的时序运动特征图;
根据目标时序帧在各卷积通道的时序运动特征图获取目标时序帧的图像数据中运动对象的动作类型。
一种动作识别方法,包括:
获取实时的监控视频数据;
提取所述监控视频数据在不同时序帧的图像数据,通过多通道卷积层获取各时序帧的图像数据在不同卷积通道上的原始子特征图;
确定目标时序帧,根据目标时序帧在各卷积通道上的原始子特征图,以及与目标时序帧相邻的后一时序帧在各卷积通道上的原始子特征图,计算目标时序帧在各卷积通道上的运动信息权重;
根据目标时序帧在各卷积通道上的运动信息权重以及目标时序帧在各卷积通道上的原始子特征图,获取目标时序帧在各卷积通道上的运动信息特征图;
对目标时序帧在各卷积通道上的运动信息特征图进行时序卷积,得到目标时序帧在各卷积通道上的时序运动特征图;
根据目标时序帧在各卷积通道的时序运动特征图获取目标时序帧的图像数据中运动对象的动作类型;
将所述动作类型确定为当前所述监控视频数据中运动对象的动作信息。
一种动作识别装置,所述装置包括:
图像获取模块,用于获取视频数据在不同时序帧的图像数据,通过多通道卷积层获取各时序帧的图像数据在不同卷积通道上的原始子特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143008.2/2.html,转载请声明来源钻瓜专利网。