[发明专利]图片中对象的识别方法和装置、存储介质及电子装置有效
申请号: | 202010463332.9 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111626212B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 俞福福;蒋忻洋;孙星;彭湃;郭晓威;黄小明;吴永坚;黄飞跃 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V20/52;G06V20/40;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 对象 识别 方法 装置 存储 介质 电子 | ||
本发明公开了一种图片中对象的识别方法和装置、存储介质及电子装置。其中,该方法包括:将待识别对象的第一图片和第二图片输入到满足正样本图片对是正样本图片对集合中距离最大的特征,负样本图片对是负样本图片对集合中距离最小的特征的损失函数的目标神经网络模型中目的,即目标神经网络模型满足具有两张图片中相同对象的距离更小,不同对象的距离更大,换句话说,目标神经网络模型满足类内的正样本图片对的距离更小与类间的负样本图片对的距离更大,从而可以精确的识别两张图片中存在的目标对象是否是同一个目标对象的技术效果,进而解决了图像中对象识别的准确性较低的技术问题。
技术领域
本发明涉及图片识别领域,具体而言,涉及一种图片中对象的识别方法和装置、存储介质及电子装置。
背景技术
行人重识别(Person re-identification缩写ReID)技术是一项利用计算器视觉技术在图片库或者视频库中检索特定行人的技术,被广泛应用于智能监控、安防等领域。实际场景中,抓拍到的行人很容易被各种静态或动态的物体所遮挡,而且由于抓拍角度的不同和行人自身移动导致的较大的视角和姿态变化,以及由于天气、时间等造成的光线变化等等都会对行人重识别的最终效果产生比较大的影响。
目前,ReID中现有的相同部分对齐的方案是:在利用深度神经网络提取整张图片的特征后,在竖直方向上将提取好的图片特征均等分,将每一块划分视为抽象的部件特征;然后,利用动态规划方法匹配每一块特征。
由上可知,现有的对齐基本考虑的都是抽象部件间的对齐,几乎都是在垂直方向上的均等划分。划分的粒度相对较大,但实际上一个图片对的差异可能在一个很小的地方。另外,上述这种特征匹配规则会造成图中的一个划分与另一张图的多个划分相匹配,也会造成每一个划分至少和另一张图的某个划分相匹配。如果对于非完整人体和图像遮挡的情况,现有技术中的图像识别计算量较大的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图片中对象的识别方法和装置、存储介质及电子装置,以至少解决图像中对象识别的准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种图片中对象的识别方法,包括:获取第一图片和第二图片,其中,所述第一图片中包括第一对象,所述第二图片中包括第二对象;将所述第一图片和所述第二图片输入目标神经网络模型,得到所述第一图片的第一特征图和所述第二图片的第二特征图,其中,所述目标神经网络模型是通过训练样本图片集合对待训练神经网络模型进行训练得到的模型,所述训练样本图片集合包括多张样本图片,所述多张样本图片中共包括多个不同的样本对象,每个所述样本对象出现在所述多张样本图片中的至少一张样本图片中,所述目标神经网络模型满足目标损失条件,所述目标损失条件包括第一损失函数的取值小于第一阈值,所述第一损失函数与所述多张样本图片中的目标正样本图片对的特征图以及目标负样本图片对的特征图相关,所述目标正样本图片对是所述每个样本对象对应的正样本图片对集合中特征距离最大的一对正样本图片对,所述目标负样本图片对的特征是所述每个样本对象对应的负样本图片对集合中特征距离最小的一对负样本图片对,所述正样本图片对集合均包括相同的对象,所述负样本对集合中的每对负样本图片对中仅有一张负样本图片包括所述相同的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010463332.9/2.html,转载请声明来源钻瓜专利网。