[发明专利]物品图像识别方法和设备、图像处理设备及介质在审
申请号: | 201910569378.6 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110413826A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 宋仁杰;魏秀参 | 申请(专利权)人: | 南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 210046 江苏省南京市栖霞*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 标识图片 特征表示 物品图片 物品图像 图像处理设备 方法和设备 图像识别 特征分割 匹配 数据库 取出 分割 | ||
本发明公开了物品图像识别方法和设备、图像处理设备及介质。该物品图像识别方法包括:从图像识别模型取出两个特征向量;针对所述两个特征向量中的每一个,进行特征分割,形成N个子特征向量,其中N为大于1的整数,并将未被分割的该特征向量也作为另外的一个子特征向量,与所述N个子特征向量共同构成与该特征向量对应的N+1个子特征向量;将每个特征向量的各子特征向量组合,作为所述待识别物品图片的特征表示;基于所述待识别物品图片的特征表示与标识图片数据库中的标识图片的特征表示,确定与所述待识别物品图片匹配的标识图片。本发明的实施例能够提高图像识别的精度。
技术领域
本发明涉及图像处理技术,尤其涉及物品图像识别方法和设备、图像处理设备及介质。
背景技术
对物品的图像进行快速、正确的识别,是人工智能及计算机视觉技术在各种应用场景(例如智慧零售场景)下实用化的关键因素。目前,得益于深度学习技术在通用图像识别任务中的成功运用,计算机自动识别物品(包括商品)的图像并在收银、检货等任务中代替人工已经成为了可能。
然而,现有技术往往将物品图像的识别问题等同于通用图像识别问题,即,先通过例如深度卷积神经网络将物品图像映射为一个M(M为大于等于1的整数)维的实值特征向量,再用C(C为大于等于2的整数)个M维的分类器,将该特征向量(对应于该物品图像)预测为C种物品中的一种。该方法主要存在以下缺陷:
1)该方法所使用的神经网络模型结构往往在通用图像识别任务上表现优异,但是,物品识别不同于通用图像识别,物品识别往往具有以下特点:例如,种类多;粒度细;而且有时在外观上的差别微小,例如对于仅仅在口味上稍有不同的物品;等等。因此,尽管现有技术的神经网络模型在通用图像识别任务上表现优异,但是在物品识别任务上,其精度却往往无法达到实用的要求。
2)由于只能将物品图像分类为预先定义好的C类中的一类,因此,当物品更换了包装,或者出现需要识别的新物品时,该方法需要重新搜集数据、重新训练模型,因此,对于“推新”,耗费过多的人力和时间成本,导致物品识别效率过低。
因此,需要一种能够提高物品图像识别的精度和/或效率的解决方案。
发明内容
为了解决以上问题之一,本发明提供了一种物品图像识别方法和设备、图像处理设备及介质。
根据本发明的一个实施例,提供一种物品图像识别方法,包括:从图像识别模型取出两个特征向量;针对所述两个特征向量中的每一个,进行特征分割,形成N个子特征向量,其中N为大于1的整数,并将未被分割的该特征向量也作为另外的一个子特征向量,与所述N个子特征向量共同构成与该特征向量对应的N+1个子特征向量;将每个特征向量的各子特征向量组合,作为所述待识别物品图片的特征表示;基于所述待识别物品图片的特征表示与标识图片数据库中的标识图片的特征表示,确定与所述待识别物品图片匹配的标识图片。
根据本发明的一个实施例,提供一种物品图像识别设备,该设备包括:特征向量获取模块,用于从图像识别模型取出两个特征向量;特征分割模块,用于针对所述两个特征向量中的每一个,进行特征分割,形成N个子特征向量,其中N为大于1的整数,并将未被分割的该特征向量也作为另外的一个子特征向量,与所述N个子特征向量共同构成与该特征向量对应的N+1个子特征向量;子特征组合模块,用于将每个特征向量的各子特征向量组合,作为所述待识别物品图片的特征表示;图片匹配模块,用于基于所述待识别物品图片的特征表示与标识图片数据库中的标识图片的特征表示,确定与所述待识别物品图片匹配的标识图片。
根据本发明的再一个实施例,提供一种图像处理设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行上面描述的方法之一。
根据本发明的又一个实施例,提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被处理器执行时,使所述处理器执行上面描述的方法之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司,未经南京旷云科技有限公司;徐州旷视数据科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910569378.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:面向时尚电商的街拍推荐系统
- 下一篇:一种用于提供目标图像信息的方法与设备