[发明专利]训练方法、装置、动作识别方法、装置及电子设备有效
申请号: | 202110227119.2 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112926462B | 公开(公告)日: | 2023-02-07 |
发明(设计)人: | 张发恩;秦树鑫 | 申请(专利权)人: | 创新奇智(西安)科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/44;G06V10/82;G06V10/766;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张萌 |
地址: | 710000 陕西省西安市高新区鱼化街办*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 方法 装置 动作 识别 电子设备 | ||
本发明涉及一种训练方法、装置、动作识别方法、装置及电子设备,在对待识别图像进行动作识别时,先对待识别图像进行第一次特征提取,得到特征图,然后将特征图输入到用于检测待识别图像中的对象的轮廓特征的轮廓特征提取网络,得到轮廓特征图,然后对轮廓特征图进行解码,得到轮廓特征向量,并将轮廓特征向量通过分类模型进行分类,得到用于表征动作类别的分类结果。由于在上述过程中,采用的是对关键点遮挡不敏感的轮廓特征提取网络,因此,即使是面对对象存在遮挡的待识别图像,轮廓特征提取网络也具有较强的抗干扰性,输出的轮廓特征图的可信度较高,进而有利于提高后续基于轮廓特征图得到的轮廓特征向量进行动作识别时的识别准确度。
技术领域
本申请属于图像处理领域,具体涉及一种训练方法、装置、动作识别方法、装置及电子设备。
背景技术
动作识别技术有着广泛的应用场景,例如用于判断人的行为属性(比如判断人的姿态是站立、坐姿、跌倒等),用于判断动物或其他可变形物体(如机器人、机械臂等)的行为姿态等。
就目前而言,主要基于传感器或基于视觉来实现动作识别。其中,相较于传感器的方式,通过视觉来进行动作识别具有成本低、无需直接接触(不需要安装传感器或实物标签等)等优势。
在实际应用中,当通过视觉来进行动作识别时,需要先训练出一个神经网络模型来辅助动作识别。在传统的基于视觉的动作识别方案中,需要神经网络模型检测出识别对象的全部关键点。以识别人体的动作为例,需要神经网络模型检测出人体骨架的21关键点,在此基础上,利用这些关键点坐标的位置信息,实现动作识别。然而,由于在应用检测关键点的模型时,模型的输入图像可能存在相互遮挡的情况,导致最后得到的关键点位置的误差较大,进而影响后续的动作识别准确度,也就是说,现有技术中的训练方式所得到的用于辅助动作识别的模型的抗干扰性较弱,不利于提高后续基于其结果进行动作识别的准确性。
发明内容
有鉴于此,本申请的目的在于提供一种训练方法、装置、动作识别方法、装置及电子设备,可以提高训练得到的轮廓特征提取网络的抗干扰性,进而提高后续通过该轮廓特征提取网络进行动作识别时的准确度。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供一种训练方法,用于训练轮廓特征提取网络,所述方法包括:获取包括多个训练样本的训练集,所述训练样本的训练标签包括:对象的中心点、所述对象的轮廓线、以所述中心点为起点且向所述轮廓线发散出N条射线后与所述轮廓线相交形成的N个轮廓关键点,相邻两条射线之间的角度差为A,且N=360/A;将所述训练样本输入到基础网络模型进行训练,直至所述基础网络模型收敛,得到所述轮廓特征提取网络;其中,所述轮廓特征提取网络的输出为与其输入特征图中的对象对应的轮廓特征图,所述轮廓特征图包括:与所述输入特征图中的对象的N个轮廓关键点一一对应的N个关键点通道、与所述输入特征图中的对象的中心点对应的中心点通道,以及与所述N个关键点通道一一对应的,用于表征该关键点通道所指向的轮廓关键点与所述输入特征图中的对象的中心点之间的距离的距离回归通道。
由于在上述训练轮廓特征提取网络的过程中,对于轮廓特征提取网络的训练样本而言,并不需要标注训练样本中所有关键点的位置,从而降到了对训练样本的标注要求,相应的,相较于传统训练检测全部关键点的神经网络模型,还可以降低工作人员的标注工作量,以及降低训练过程中的训练成本,提高训练速度。此外,由于轮廓特征提取网络最终的输出是对象的轮廓特征图,且轮廓对于小部分遮挡并不是特别敏感,因此,对于输入特征图中的对象存在遮挡的情况,轮廓特征提取网络具有较好的适应性,也就是说,轮廓特征提取网络具有较强的抗干扰性,输出的结果的可信度较高,进而有利于提高后续基于轮廓特征提取网络的输出结果进行动作识别时的识别准确度。
结合第一方面实施例,在一种可能的实施方式中,当在所述输入特征图中包括多个对象时,所述轮廓特征提取网络的输出为与每个对象对应的轮廓特征图。也就是说,通过上述训练方法训练得到的轮廓特征提取网络具备同时识别多个对象的轮廓特征图的功能,可以提高识别效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(西安)科技有限公司,未经创新奇智(西安)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110227119.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种菠萝包制作方法
- 下一篇:一种模块化的土体深部位移实时测量装置