[发明专利]手持物体识别方法及装置在审
申请号: | 202010756462.1 | 申请日: | 2020-07-29 |
公开(公告)号: | CN112016398A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 郝磊;岳俊;许松岑 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F16/583;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手持 物体 识别 方法 装置 | ||
1.一种手持物体识别方法,其特征在于,包括:
获取待识别图像中一个或多个检测对象中每个检测对象的位置信息,并获取所述每个检测对象的第一标签,所述每个检测对象的位置信息为该检测对象在所述待识别图像中的位置信息,所述检测对象的第一标签用于指示所述检测对象的类型,所述检测对象的类型用于表征所述检测对象的手持关系;
根据所述每个检测对象的第一标签从所述一个或多个检测对象中获取所述手持物体,并从所述一个或多个检测对象的位置信息获取所述手持物体的位置信息;
根据所述手持物体的位置信息对所述待识别图像中所述手持物体进行识别,以得到所述手持物体的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述第一标签包括子类标签,所述子类标签用于指示所述检测对象的第一类型,所述获取所述每个检测对象的第一标签,包括:
在获取所述待识别图像的第一特征向量后,对所述待识别图像的第一特征向量进行第一卷积操作,以得到所述待识别图像的第二特征向量;
对所述待识别图像的第二特征向量进行第一全连接操作,以得到所述每个检测对象的第一标签,其中,所述第一类型包括手持状态下的物体和非手持状态下的物体。
3.根据权利要求2所述的方法,其特征在于,所述第一类型还包括持有物体的手和未持有物体的手。
4.根据权利要求3所述的方法,其特征在于,所述第一标签还包括超类标签,所述超类标签用于指示所述检测对象的第二类型,所述第一类型为所述第二类型的子类,所述获取所述每个检测对象的第一标签还包括:
在获取所述待识别图像的第一特征向量后,对所述第一特征向量进行第二卷积操作,以得到所述待识别图像的第三特征向量;
将所述第二特征向量和所述第三特征向量进行融合操作,以得到所述待识别图像的第四特征向量;
对所述第四特征向量进行第三卷积操作,以得到所述待识别图像的第五特征向量;
对所述第五特征向量进行第二全连接操作,以得到所述每个检测对象的超类标签;其中,第二类型包括手和物体。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取所述待识别图像中一个或多个检测对象中每个检测对象的位置信息,包括:
在获取待识别图像的第一特征向量后,根据所述待识别图像的第一特征向量对所述待识别图像中一个或多个检测对象进行边框回归操作,以得到所述一个或多个检测对象中每个检测对象的位置信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述手持物体的位置信息对所述待识别图像中所述手持物体进行识别,以得到所述手持物体的识别结果,包括:
根据所述手持物体的位置信息从所述待识别图像中裁剪出包含所述手持物体的图像块,所述图像块为所述待识别图像的一部分;
对所述图像块中的所述手持物体进行特征提取,以得到所述手持物体的第一特征向量;
根据所述手持物体的第一特征向量确定所述手持物体的参考标签及第一置信度,所述第一置信度为所述手持物体的标签为所述参考标签的概率;
根据所述手持物体的参考标签和第一置信度获取所述手持物体的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010756462.1/1.html,转载请声明来源钻瓜专利网。