[发明专利]图片中对象的识别方法和装置、存储介质及电子装置有效
申请号: | 202010463332.9 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111626212B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 俞福福;蒋忻洋;孙星;彭湃;郭晓威;黄小明;吴永坚;黄飞跃 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V20/52;G06V20/40;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 对象 识别 方法 装置 存储 介质 电子 | ||
1.一种图片中对象的识别方法,其特征在于,包括:
获取第一图片和第二图片,其中,所述第一图片中包括第一对象,所述第二图片中包括第二对象;
将所述第一图片和所述第二图片输入目标神经网络模型,得到所述第一图片的第一特征图和所述第二图片的第二特征图,其中,所述目标神经网络模型是通过训练样本图片集合对待训练神经网络模型进行训练得到的模型,所述训练样本图片集合包括多张样本图片,所述多张样本图片中共包括多个不同的样本对象,每个所述样本对象出现在所述多张样本图片中的至少一张样本图片中,所述目标神经网络模型满足目标损失条件,所述目标损失条件包括每个样本对象对应的第一损失函数的取值小于第一阈值,所述第一损失函数与所述多张样本图片中的目标正样本图片对的特征图以及目标负样本图片对的特征图相关,所述目标正样本图片对是所述每个样本对象对应的正样本图片对集合中特征距离最大的一对正样本图片对,所述目标负样本图片对的特征是所述每个样本对象对应的负样本图片对集合中特征距离最小的一对负样本图片对,所述正样本图片对集合均包括相同的对象,所述负样本对集合中的每对负样本图片对中仅有一张负样本图片包括所述相同的对象;
通过所述目标神经网络模型对所述第一图片的所述第一特征图和所述第二图片的所述第二特征图进行处理,得到识别结果,其中,所述识别结果用于指示所述第一图片中的所述第一对象和所述第二图片中的所述第二对象为同一对象或者为不同对象。
2.根据权利要求1所述的方法,其特征在于,将所述第一图片和所述第二图片输入目标神经网络模型之前,所述方法包括:
获取所述训练样本图片集合,其中,所述训练样本图片集合包括N张样本图片,所述N张样本图片中共包括K个不同的样本对象,每个所述样本对象出现在所述N张样本图片中的P张样本图片中,N和K为大于1的自然数,P为自然数;
使用所述训练样本图片集合对所述待训练神经网络模型进行训练,得到满足目标损失函数的所述目标神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述使用所述训练样本图片集合对所述待训练神经网络模型进行训练,包括:
将所述N张样本图片输入所述待训练神经网络模型中,通过所述待训练神经网络模型获取每张所述样本图片的C个特征图,得到N*C个特征图,其中,所述N*C个特征图中的每个特征图的高为H,宽为W,H和W为大于1的自然数,C为自然数;
根据所述N*C个特征图中所述正样本图片对的特征以及所述负样本图片对的特征,获取所述第一损失函数的取值,其中,所述正样本图片对的特征是所述N*C个特征图中距离最大的特征,所述负样本图片对的特征是所述N*C个特征图中距离最小的特征;
在所述待训练神经网络模型满足所述目标损失条件的情况下,结束对所述待训练神经网络模型的训练,将结束训练时的所述待训练神经网络模型确定为所述目标神经网络模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述N*C个特征图中所述正样本图片对的特征以及所述负样本图片对的特征,获取所述第一损失函数的取值,包括:
Ltop_k=max(0,Tmax(fa,fp)-Tmin(fa,fn)+m)
其中,fa,fp是所述训练样本图片集合中第a张图片与其余任意一张图片p的组成正样本对,所述正样本对对应的特征图之间的距离,fa,fn是所述训练样本图片集合中第a张图片与其余任意一张图片n组成负样本对,所述负样本对对应的特征图之间距离,m是常量;
其中,
Z={(i,j)|0≤i<HW,0≤j<HW,(xi-yj)2≤Top(x-y)}
其中,所述xi是所述训练样本图片集合中第x张图片对应的特征图的第i个单元格对应特征值,所述yj是所述训练样本图片集合中第y张图片对应的特征图的第j个单元格对应特征值,所述单元格是对所述第x张图片和所述y张图片进行相同大小网格化得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010463332.9/1.html,转载请声明来源钻瓜专利网。