[发明专利]一种提袋识别方法及装置有效
申请号: | 202010217503.X | 申请日: | 2020-03-25 |
公开(公告)号: | CN111340002B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 钱扬;孟强;侯瑶淇 | 申请(专利权)人: | 北京爱笔科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/24;G06V10/764 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张建 |
地址: | 100094 北京市海淀区北清路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 | ||
本发明公开了一种提袋识别方法及装置,通过获得提袋检测网络模型对目标图像进行检测后输出的至少一个提袋候选框,对所述目标图像中的人体关键点进行识别,根据识别到的至少部分人体关键点确定与所述至少部分人体关键点相关的提袋候选区域,将位于所述提袋候选区域之外的提袋候选框确定为误识别候选框,可以根据人体关键点确定与提袋相关度较低甚至无关的误识别候选框,将未确定为误识别候选框的提袋候选框均确定为提袋或进行下一步的识别,有效提高了提袋识别的准确率。
技术领域
本发明涉及图像识别领域,尤其涉及一种提袋识别方法及装置。
背景技术
随着图像识别技术的发展,提袋识别技术不断提高。
提袋是一种由纸张、塑料、皮革、纺织品、金属或工业纸板等材料制作而成的袋子。现今,提袋已逐渐成为人们在出行时的必要用品,如用于盛放物品、时尚装扮等。
本申请发明人经研究发现,对图像中的提袋进行有效识别具有诸多用处,比如,用于在超市入口处检测客户是否携带手提袋,以提醒客户将手提袋放入寄存柜中;又比如,用于在博物馆等具有重要物品的场所中检测客户是否携带手提袋,以进行安全报警。
但是,提袋外观特征复杂(例如形变大、纹理特征少、遮挡严重),导致目前的图像识别技术在进行提袋检测时,会生成与提袋相关度较低甚至无关的提袋候选框(即误检的提袋候选框),提袋识别的准确率低。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的提袋识别方法及装置,技术方案如下:
一种提袋识别方法,包括:
获得提袋检测网络模型对目标图像进行检测后输出的至少一个提袋候选框;
对所述目标图像中的人体关键点进行识别,根据识别到的至少部分人体关键点确定与所述至少部分人体关键点相关的提袋候选区域;
将位于所述提袋候选区域之外的提袋候选框确定为误识别候选框。
可选的,所述方法还包括:
将所述目标图像中至少部分提袋候选框内的图像输入预设的提袋分类网络模型中,获得所述预设的提袋分类网络模型输出的置信度,其中,所述置信度为输入所述预设的提袋分类网络模型的图像为提袋图像的置信度;
将低于第一预设阈值的所述置信度对应的提袋候选框确定为误识别候选框。
可选的,所述方法还包括:
确定所述目标图像中至少部分提袋候选框间的重合度(IOU,Intersection OverUnion);
将重合度高于第二预设阈值的两个提袋候选框中的一个提袋候选框确定为误识别候选框。
可选的,所述根据识别到的至少部分人体关键点确定与所述至少部分人体关键点相关的提袋候选区域,包括:
确定识别到的至少部分人体关键点的横坐标和纵坐标;
确定各所述横坐标中的横坐标最大值和横坐标最小值,确定各所述纵坐标中的纵坐标最大值和纵坐标最小值;
将第一直线、第二直线、第三直线和第四直线围绕形成的矩形区域确定为:与所述至少部分人体关键点相关的提袋候选区域,其中,所述第一直线上各点的横坐标均为所述横坐标最大值,所述第二直线上各点的横坐标均为所述横坐标最小值,所述第三直线上各点的纵坐标均为所述纵坐标最大值,所述第四直线上各点的纵坐标均为所述纵坐标最小值。
可选的,所述人体关键点包括:鼻子、眼睛、耳朵、肩部、肘部、手腕、臀部、膝盖和脚踝中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱笔科技有限公司,未经北京爱笔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010217503.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:像素驱动电路及其驱动方法和显示装置
- 下一篇:一种渲染方法及装置