[发明专利]一种基于间隔分布的Siamese网络图像识别方法及系统有效
申请号: | 202010311079.5 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111461255B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 荆晓远;朱晨;贾晓栋;孔晓辉 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 间隔 分布 siamese 网络 图像 识别 方法 系统 | ||
1.一种基于间隔分布的Siamese网络图像识别方法,其特征在于,包括:
S1:建立训练数据集,训练数据集由图像对组成;
S2:构建图像识别模型,其中,图像识别模型为Siamese网络,包括两个相同的子网络,每个子网络接收一张图像,并在输出处相连,子网络用于将相似的输入向量映射到输出流形上的附近点,将不相似的向量映射到远点,并得到在映射空间中的特征向量对,其中,相似的输入向量为图像对的表示;
S3:将训练数据集输入至构建的图像识别模型中,根据特征向量对之间的距离构建对比损失函数,并构建同类别数据之间的间隔分布损失函数,根据对比损失函数与间隔分布损失函数得到目标损失函数,通过最小化目标损失函数对模型进行训练,得到训练好的图像识别模型;
S4:将待识别的图像输入训练好的图像识别模型中,得到预测类别;
其中,S3包括:
S3.1:根据特征向量对之间的距离构建对比损失函数
上式中,分别表示输入至两个子网络的图像对,Y为标签,当Y=0时,表示输入的图像对为同类,Y=1时,输入的图像对为异类,DW表示为输出样本在特征空间的欧氏距离,表示如下:
GW表示子网络的映射函数;
S3.2:构建同类别数据之间的间隔分布损失函数V(x,y):
上式中,xi表示类别为i的所有图像,yi表示xi的标签数据,表示对输出向量集合求方差,GW(X)表示一个批次的训练数据集经过Siamese子网络后的输出向量集合,m表示训练数据样本的类别数量,每个类别包含的图像数量是相同的,都表示为n,输出向量集合表示输入数据x经过子网络后得到的一组向量,对输出向量集合求方差具体为对每个类别的类内方差进行开方后求和;
S3.3:将对比损失函数与间隔分布损失函数进行求和,并使用超参数τ平衡二者大小,得到目标损失函数f(x):
其中,m表示训练样本的类别数量,每个类别包含的图像数量是相同的,都表示为n;
S3.4:通过最小化目标损失函数对模型进行迭代训练,当满足条件时,得到训练好的图像识别模型。
2.如权利要求1所述的方法,其特征在于,S2中Siamese网络的两个子网络从输入的图像对中分别提取特征,并在输出处测量经过子网络输出的两个特征向量之间的距离,其中,子网络输出的特征向量之间的距离为DW,表示输出样本在特征空间的欧氏距离,具体如下:
上式中,分别表示输入至两个子网络的图像对,GW表示子网络的映射函数。
3.如权利要求1所述的方法,其特征在于,当特征向量对之间的距离小于阈值时,则表示与特征向量对对应的图像对为同类,否则为异类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010311079.5/1.html,转载请声明来源钻瓜专利网。