[发明专利]一种视频行为识别方法、装置、存储介质和服务器有效
申请号: | 201910422559.6 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110222598B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 周俊琨;罗郑楠;官民;许扬 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06N3/08 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 冷仔 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机技术领域,提出一种视频行为识别方法、装置、存储介质和服务器。首先获取待识别视频,从所述待识别视频中提取出多帧视频图像;然后将所述多帧视频图像输入预先训练完成的神经网络模型,以获得该神经网络模型输出的行为识别结果。本发明在该神经网络模型的结构中添加了以下数据处理逻辑:获取所述多帧视频图像的图像处理数据,该图像处理数据为包含图像全局特征信息的四维矩阵,通过对该四维矩阵进行卷积处理,能够得到包含图像局部特征信息的四维矩阵,然后将该包含图像全局特征信息的四维矩阵和该包含图像局部特征信息的四维矩阵分别平铺后再相乘,从而将视频图像的局部特征与全局特征相结合,能够提高视频行为识别的准确率。 | ||
搜索关键词: | 一种 视频 行为 识别 方法 装置 存储 介质 服务器 | ||
【主权项】:
1.一种视频行为识别方法,其特征在于,包括:获取待识别视频;从所述待识别视频中提取出多帧视频图像;将所述多帧视频图像输入预先训练完成的目标神经网络模型,获得所述目标神经网络模型输出的行为识别结果;其中,所述目标神经网络模型包括第一处理层和第二处理层,所述第一处理层和所述第二处理层为所述目标神经网络模型的网络结构中相邻的两个卷积层,所述目标神经网络将所述多帧视频图像转换为四个维度的图像数据进行处理,所述第一处理层和第二处理层之间的处理逻辑如下:获取所述第一处理层输出的四维矩阵格式的第一图像处理数据,所述第一处理层用于接收上一个处理层输出的图像处理数据,对接收到的图像处理数据执行卷积处理,得到所述第一图像处理数据;对所述第一图像处理数据进行矩阵的平铺处理,获得二维矩阵格式的第二图像处理数据;对所述第一图像数据进行卷积处理后,执行矩阵的平铺处理,获得二维矩阵格式的第三图像处理数据;将所述第三图像处理数据和所述第二图像处理数据相乘,获得二维矩阵格式的第四图像处理数据;对所述第四图像处理数据进行矩阵的逆平铺处理,得到四维矩阵格式的第五图像处理数据;将所述第五图像处理数据输入所述第二处理层,所述第二处理层用于对所述第五图像处理数据执行卷积处理,然后将处理后的数据输入下一个处理层。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910422559.6/,转载请声明来源钻瓜专利网。
- 上一篇:基于微表情调节屏幕显示的方法及装置
- 下一篇:一种基于高斯映射的步态识别方法