[发明专利]人机交互动作检测方法、装置、存储介质及处理器在审
申请号: | 201710670075.4 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107423721A | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 王志鹏;周文明 | 申请(专利权)人: | 珠海习悦信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G06F3/01 |
代理公司: | 北京挺立专利事务所(普通合伙)11265 | 代理人: | 倪钜芳 |
地址: | 519080 广东省珠海市高新区唐*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机交互 动作 检测 方法 装置 存储 介质 处理器 | ||
1.一种人机交互动作检测方法,其特征在于,包括:
根据预设多层卷积神经网络对目标图片进行检测,得到所述目标图片中存在的至少一个目标对象对应的类别以及所述至少一个目标对象对应的边框坐标;
确定所述至少一个目标对象中置信度最高的所述目标对象为目标检测对象;
将所述目标检测对象对应的所述类别和所述目标检测对象对应的所述边框坐标输入至预设多阶段回归卷积神经网络,进而根据所述预设多阶段回归卷积神经网络对所述目标检测对象进行人体关节部位的位置检测,得到所述目标检测对象中的所述人体关节部位的位置坐标;
对所述位置坐标进行归一化处理,进而根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果,其中,所述检测结果中至少包括所述目标图片的类别标签。
2.根据权利要求1所述的方法,其特征在于,在根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测之前,所述方法还包括:根据预设损失函数和预设算法对所述预设多层递归神经网络进行训练,其中,所述预设损失函数为分类函数,所述预设算法为基于时间尺度的反向传播算法。
3.根据权利要求1所述的方法,其特征在于,所述根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果包括:
根据所述预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片对应的多个类别以及所述多个类别中的每个所述类别对应的多个激活值;
在预设时间窗内获取每个所述类别对应的所述多个激活值的平均值;
将多个所述平均值中的最大平均值对应的所述类别确定为所述目标图片的类别标签,从而得到所述检测结果。
4.根据权利要求1所述的方法,其特征在于,在根据预设多层卷积神经网络对目标图片进行检测之前,所述方法还包括:
获取预设摄像头中拍摄到的人体姿态视频图像;
将所述人体姿态视频图像中的任意一帧图片确定为所述目标图片。
5.一种人机交互动作检测装置,其特征在于,包括:
检测单元,用于根据预设多层卷积神经网络对目标图片进行检测,得到所述目标图片中存在的至少一个目标对象对应的类别以及所述至少一个目标对象对应的边框坐标;
第一确定单元,用于确定所述至少一个目标对象中置信度最高的所述目标对象为目标检测对象;
第一处理单元,用于将所述目标检测对象对应的所述类别和所述目标检测对象对应的所述边框坐标输入至预设多阶段回归卷积神经网络,进而根据所述预设多阶段回归卷积神经网络对所述目标检测对象进行人体关节部位的位置检测,得到所述目标检测对象中的所述人体关节部位的位置坐标;
第二处理单元,用于对所述位置坐标进行归一化处理,进而根据预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片的检测结果,其中,所述检测结果中至少包括所述目标图片的类别标签。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
训练单元,用于根据预设损失函数和预设算法对所述预设多层递归神经网络进行训练,其中,所述预设损失函数为分类函数,所述预设算法为基于时间尺度的反向传播算法。
7.根据权利要求5所述的装置,其特征在于,所述第二处理单元包括:
检测子单元,用于根据所述预设多层递归神经网络对完成所述归一化处理之后的所述位置坐标进行检测,得到所述目标图片对应的多个类别以及所述多个类别中的每个所述类别对应的多个激活值;
获取子单元,用于在预设时间窗内获取每个所述类别对应的所述多个激活值的平均值;
确定子单元,用于将多个所述平均值中的最大平均值对应的所述类别确定为所述目标图片的类别标签,从而得到所述检测结果。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取预设摄像头中拍摄到的人体姿态视频图像;
第二确定单元,用于将所述人体姿态视频图像中的任意一帧图片确定为所述目标图片。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求4中任意一项所述的人机交互动作检测方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求4中任意一项所述的人机交互动作检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海习悦信息技术有限公司,未经珠海习悦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710670075.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:目标跟踪系统和立体显示设备
- 下一篇:一种自动燃烧器