[发明专利]物品陈列图像方向识别方法、装置、电子设备及存储介质有效
申请号: | 202310154186.5 | 申请日: | 2023-02-23 |
公开(公告)号: | CN115841571B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 敖川;李素莹;陈果;高达辉 | 申请(专利权)人: | 青岛创新奇智科技集团股份有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V20/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 赵兴 |
地址: | 266200 山东省青岛市即墨区经*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品 陈列 图像 方向 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供一种物品陈列图像方向识别方法、装置、电子设备及存储介质,涉及图像处理技术领域,用于改善物品陈列图像方法的识别准确率,其中物品陈列图像方向识别方法包括:获取物品陈列图像中物品的识别框;对识别框进行扩大处理,获取识别扩大框;根据预设扩大框重叠判定规则,获取识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量;基于识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量判断物品陈列图像的方向为非正立还是正立。采用扩大框重叠数量来判断物品陈列图像的方向,无需考虑训练集分布,泛化能力较强。
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种物品陈列图像方向识别方法、装置、电子设备及存储介质。
背景技术
现有技术中对物品陈列图像方向的识别大都采用深度学习方法来识别图像旋转角度,该方法的泛化性能弱,仅能针对训练集内的样本进行识别,对训练集分布之外样本的识别准确率较低。
发明内容
本申请实施例的目的在于提供一种物品陈列图像方向识别方法、装置、电子设备及存储介质,用以改善物品陈列图像方法的识别准确率。
第一方面,本申请实施例提供一种物品陈列图像方向识别方法,包括:获取物品陈列图像中物品的识别框;对所述识别框进行扩大处理,获取识别扩大框;根据预设扩大框重叠判定规则,获取所述识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量;基于所述识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量判断所述物品陈列图像的方向为非正立还是正立。
在上述方案的实现过程中,采用扩大框重叠数量来判断物品陈列图像的方向,相较于现有技术中采用深度学习来识别图像方向的方法,本申请实施例所提出的上述方案可以仅在CPU内完成运算,不占用GPU资源;另外,由于仅需要判断横轴方向与纵轴方向上扩大框重叠数量的大小即可实现对物品陈列图像方向的识别,运算速度快,效率高;同时,相较于现有技术中采用深度学习的方式,本申请实施例所提出的上述方案无需考虑训练集分布,泛化能力较强,对图像的识别准确率也较高。
在第一方面的一种实现方式中,所述获取所述识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量,包括:获取所述识别扩大框之间的重叠面积;若所述识别扩大框之间的重叠面积大于0,则获取所述识别扩大框在横轴方向上的长度重叠指标以及在纵轴方向上的长度重叠指标;基于所述识别扩大框在横轴方向上的长度重叠指标以及在纵轴方向上的长度重叠指标,统计识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量。
在上述方案的实现过程中,通过计算能够表征识别扩大框长度重叠比例的长度重叠指标来统计识别扩大框沿横轴方向以及纵轴方向上的扩大框数量,可以有效筛选出横轴方向上或者纵轴方向上的识别扩大框长度重叠有一定比例的识别扩大框,并对其进行计数,获得扩大框重叠数量,通过扩大框重叠数量即可获得图像方向,计算过程可以在CPU中实现,无需占用GPU资源,处理速度快,提高了上述物品陈列图像方向识别方法的识别效率。
在第一方面的一种实现方式中,所述基于所述识别扩大框在横轴方向上的长度重叠指标以及在纵轴方向上的长度重叠指标,统计识别扩大框沿横轴方向以及纵轴方向上的扩大框重叠数量,包括:统计所述识别扩大框之间的重叠面积大于0,且所述识别扩大框在横轴方向上的长度重叠指标满足横轴长度重叠指标阈值的识别扩大框的数量,将其作为识别扩大框沿横轴方向上的扩大框重叠数量;统计所述识别扩大框之间的重叠面积大于0,且所述识别扩大框在纵轴方向上的长度重叠指标满足纵轴长度重叠指标阈值的识别扩大框的数量,将其作为识别扩大框沿纵轴方向上的扩大框重叠数量。
在上述方案的实现过程中,通过预先设置的长度重叠指标阈值,即可获得扩大框重叠数量,进而通过扩大框重叠数量即可获得图像方向,提高了上述物品陈列图像方向识别方法的识别效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛创新奇智科技集团股份有限公司,未经青岛创新奇智科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310154186.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序