[发明专利]视频数据实时姿态识别方法及装置、计算设备在审
申请号: | 201711157088.8 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107944376A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 董健 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙)11276 | 代理人: | 宋菲,刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据 实时 姿态 识别 方法 装置 计算 设备 | ||
技术领域
本发明涉及深度学习领域,具体涉及一种视频数据实时姿态识别方法及装置、计算设备。
背景技术
姿态识别主要通过两种方式,一种是利用外部设备,如可穿戴的传感器或手柄等设备,具有精确直接的特点,但对肢体动作造成束缚,且对外部设备依赖性高。另一种基于提取人体的各个关节的关键点信息,如手、手肘、肩膀等各个关节,通过计算各关节关键点位置信息交叉或平行等进行姿态识别。
现有技术中,在对图像采集设备所采集到的图像进行识别时所使用的神经网络往往具有多层中间层,这样可以得到更精准的识别结果。但多层中间层的计算速度会较慢,不能快速的识别,无法快速的得到当前帧图像中的具体情况。尤其当姿态实时变化时,会使得识别结果延迟于当前帧图像。而使用中间层较少的神经网络时,由于中间层层数较少,其计算速度较快,但受其层数限制,有可能造成计算能力有限、拟合能力较差、得到结果不准确等问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的视频数据实时姿态识别方法及装置、计算设备。
根据本发明的一个方面,提供了一种视频数据实时姿态识别方法,其包括:
实时获取图像采集设备所拍摄和/或所录制的视频中的包含特定对象的当前帧图像;
将当前帧图像输入至第二神经网络中,得到对当前帧图像中特定对象的姿态识别结果;其中,第二神经网络利用预先训练的第一神经网络的至少一层中间层的输出数据进行指导训练得到,第一神经网络的层数多于第二神经网络的层数;
根据特定对象的姿态识别结果,确定对应的待响应的命令,以供图像采集设备所在终端设备响应待响应的命令。
可选地,图像采集设备所在终端设备所显示的图像为当前帧图像;
根据特定对象的姿态识别结果,确定对应的待响应的命令,以供图像采集设备所在终端设备响应待响应的命令进一步包括:
根据特定对象的姿态识别结果,确定对应的对当前帧图像待响应的效果处理命令,以供图像采集设备所在终端设备响应待响应的效果处理命令。
可选地,根据特定对象的姿态识别结果,确定对应的对当前帧图像待响应的效果处理命令,以供图像采集设备所在终端设备响应待执行的效果处理命令进一步包括:
根据特定对象的姿态识别结果,以及当前帧图像中的包含的与其他对象的交互信息,确定对应的对当前帧图像待响应的效果处理命令。
可选地,待响应的效果处理命令包括效果贴图处理命令、风格化处理命令、亮度处理命令、光照处理命令和/或色调处理命令。
可选地,图像采集设备所在终端设备所显示的图像不是当前帧图像;
根据特定对象的姿态识别结果,确定对应的待响应的命令,以供图像采集设备所在终端设备响应待响应的命令进一步包括:
获取图像采集设备所在终端设备所显示的图像;
根据特定对象的姿态识别结果,确定对应的图像待响应的命令,以供图像采集设备所在终端设备响应待响应的命令。
可选地,第二神经网络的训练过程包括:
将姿态识别的训练样本数据输入至经训练得到的第一神经网络中,获得第一神经网络的至少一层第一中间层的输出数据;
将姿态识别的训练样本数据输入至待训练的第二神经网络中,获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据,至少一层第二中间层与至少一层第一中间层具有对应关系;
利用至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失,以及最终输出数据与预标注的输出数据之间的损失,对第二神经网络进行训练。
可选地,至少一层第一中间层包含第一神经网络的瓶颈层;至少一层第二中间层包含第二神经网络的瓶颈层。
可选地,利用至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失,以及最终输出数据与预标注的输出数据之间的损失,对第二神经网络进行训练进一步包括:
根据至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失更新第二神经网络的权重参数,根据最终输出数据与预标注的输出数据之间的损失更新第二神经网络的权重参数,对第二神经网络进行训练。
可选地,在将训练样本的输入数据输入至待训练的第二神经网络中,获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据之前,方法还包括:
将姿态识别的训练样本数据进行下采样处理,将处理后的数据作为第二神经网络的姿态识别的训练样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711157088.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置