[发明专利]递归神经网络的训练方法、识别方法、装置及处理设备有效

专利信息
申请号: 201810870041.4 申请日: 2018-08-01
公开(公告)号: CN109086873B 公开(公告)日: 2021-05-04
发明(设计)人: 张弛;曹宇 申请(专利权)人: 北京旷视科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 郭新娟
地址: 100000 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 递归 神经网络 训练 方法 识别 装置 处理 设备
【说明书】:

发明提供了一种递归神经网络的训练方法、识别方法、装置及处理设备,涉及动作识别技术领域,该方法包括:获取训练样本,训练样本包括视频的多帧图像序列及视频对应的动作标识;对多帧图像序列进行特征提取,得到图像序列特征,图像序列特征包括每帧图像的特征;将图像序列特征输入递归神经网络进行动作分类,获得每帧图像的动作分类概率;其中,动作分类包含无动作类;基于动作分类概率,根据连接时序分类方法计算损失函数;通过对损失函数进行反向传播以训练递归神经网络。本发明实施例可以对动作之间的连接关系进行更好的学习,对于时间序列的动作预测更为准确,从而可以对动作进行更细粒度,更准确的动作识别。

技术领域

本发明涉及动作识别技术领域,尤其是涉及一种递归神经网络的训练方法、识别方法、装置及处理设备。

背景技术

现有的基于神经网络的动作识别技术基本分为两类:基于单帧图像的识别方法和基于多帧图像的识别方法。

其中,基于单帧图像的识别方法,直接对视频中的单帧使用CNN(ConvolutionalNeural Network,卷积神经网络)进行特征提取,直接进行动作的分类识别。其优点是训练速度快,收敛快,对于一些静态特征明显的动作有较好的分类效果,缺点是忽略了时间信息,容易对场景多拟合而单纯得变成了场景识别,如开和关的动作就无法得到区分。基于多帧图像的识别方法,对动作视频序列进行抽帧组成图像序列进行训练,使用CNN提取图像特征并加入注意力等机制学习时间信息,同时还可以加入长短期记忆模块LSTM(Long Short-Term Memory)等RNN(Recurrent Neural Network,递归神经网络)模块对时间维度信息进行学习和综合。然而其输出仍然是单独的动作分类标签,将一个图像序列分为一个动作,而无法进行逐帧的动作识别预测,也无法对动作的时序转换关系进行学习。

针对上述基于多帧图像的识别方法存在的问题,还未提出有效解决方案。

发明内容

有鉴于此,本发明的目的在于提供一种递归神经网络的训练方法、识别方法、装置及处理设备,可以对动作之间的时序转换关系进行学习,从而对动作进行更细粒度,更准确的动作识别。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种递归神经网络的训练方法,所述方法包括:获取训练样本,所述训练样本包括视频的多帧图像序列及所述视频对应的动作标识;对所述多帧图像序列进行特征提取,得到图像序列特征,所述图像序列特征包括每帧图像的特征;将所述图像序列特征输入递归神经网络进行动作分类,获得所述每帧图像的动作分类概率;其中,动作分类包含无动作类;基于所述动作分类概率,根据连接时序分类方法计算损失函数;通过对所述损失函数进行反向传播以训练递归神经网络。

进一步,所述对所述多帧图像序列进行特征提取,得到图像序列特征的步骤,包括:将所述多帧图像序列输入卷积神经网络进行空间特征提取;将提取得到的空间特征输入长短期记忆模块进行时间特征提取;将提取得到的时间特征作为图像序列特征。

进一步,所述将所述图像序列特征输入递归神经网络进行动作分类,获得所述每帧图像的动作分类概率的步骤,包括:将所述每帧图像的特征输入递归神经网络的Softmax层,得到每个时间所述每帧图像的动作分类概率。

进一步,所述基于所述动作分类概率,根据连接时序分类方法计算损失函数的步骤,包括:将所述动作分类概率乘以所述动作分类概率对应的时间,计算所述多帧图像序列的分类概率;对所述多帧图像序列的分类概率通过动态规划方式,使用连接时序分类方法计算动作标识错误率;将所述动作标识错误率作为损失函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810870041.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top