[发明专利]目标对象的动作识别方法、装置和电子设备有效
申请号: | 201910353500.6 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110070063B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 罗国中 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 动作 识别 方法 装置 电子设备 | ||
本公开公开了一种目标对象的动作识别方法、装置和电子设备。其中,所述目标对象的动作识别方法包括:从图像源获取原始图像,所述原始图像中包括目标对象;从所述原始图像中识别出所述目标对象;检测所述目标对象的多个关键点;通过检测到的关键点判断所述多个关键点的可见性属性,其中所述可见性属性用于表示所述关键点是否被遮挡;根据所述多个关键点的可见性属性的组合值识别所述目标对象的动作。本公开通关键点的可见性来判断目标对象的动作,解决了现有技术中的对复杂动作识别不准确的技术问题。
技术领域
本公开涉及目标识别以及图像处理领域,特别是涉及一种目标对象的动作识别方法、装置和电子设备。
背景技术
随着计算机技术的发展,智能终端的应用范围得到了广泛的提高,例如可以通过智能终端听音乐、玩游戏、上网聊天和拍照等。对于智能终端的拍照技术来说,其拍照像素已经达到千万像素以上,具有较高的清晰度和媲美专业相机的拍照效果。
目前在采用智能终端进行拍照时,不仅可以使用出厂时内置的拍照软件实现传统功能的拍照效果,还可以通过从网络端下载应用程序(Application,简称为:APP)来实现具有附加功能的拍照效果或者给视频加上特殊效果。在加入效果之前,有时候还会对用户的动作进行识别。
现有技术中一般可以使用多帧之间目标对象的状态变化来判断目标对象的简单动作,比如手掌的远近等,但是这样仅仅通过简单的状态的变化来判断目标对象的动作的方式无法识别一些比较复杂的动作。
发明内容
根据本公开的一个方面,提供以下技术方案:
一种目标对象的动作识别方法,包括:从图像源获取原始图像,所述原始图像中包括目标对象;从所述原始图像中识别出所述目标对象;检测所述目标对象的多个关键点;通过检测到的关键点判断所述多个关键点的可见性属性,其中所述可见性属性用于表示所述关键点是否被遮挡;根据所述多个关键点的可见性属性的组合值识别所述目标对象的动作。
进一步的,在所述根据所述多个关键点的可见性属性的组合值识别所述目标对象的动作之后,还包括:判断所述目标对象的动作是否为第一动作;如果所述目标对象的动作是第一动作,则使用与所述第一动作对应的第一处理对所述原始图像进行处理。
进一步的,所述从所述原始图像中识别出所述目标对象,包括:获取原始图像的当前图像帧;抽取所述图像帧中的图像特征形成特征图像;在所述特征图像中生成多个矩形框;判断每个矩形框中所包含的目标对象的图像特征的数量;将包含目标对象的图像特征数量最多的矩形框输出作为目标对象的外接框。
进一步的,所述检测所述目标对象的多个关键点,包括:将所述识别出的目标对象输入关键点检测模型;所述关键点检测模型输出每个关键点在所述原始图像上的坐标。
进一步的,所述通过检测到的关键点判断所述多个关键点的可见性属性,其中所述可见性属性用于表示所述关键点是否被遮挡,包括:将检测出多个关键点的目标对象输入可见性判断模型;可见性判断模型输出所述多个关键点中的每一个的可见性概率;将所述可见性概率与第一阈值比较并输出所述可见性属性的值。
进一步的,所述根据所述多个关键点的可见性属性的组合值识别所述目标对象的动作,包括:获取所述多个关键点的可见性属性的组合值的参考值,其中所述参考值与特定动作对应;将所述可见性属性的组合值与所述参考值进行对比;如果所述组合值与所述参考值匹配,输出所述参考值所对应的特定动作为识别出的目标对象的动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910353500.6/2.html,转载请声明来源钻瓜专利网。