[发明专利]一种模型训练方法、手镯识别方法及对应装置在审
申请号: | 202010834303.9 | 申请日: | 2020-08-18 |
公开(公告)号: | CN111985554A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 柯政远;李锴莹 | 申请(专利权)人: | 创新奇智(西安)科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/194;G06T7/40;G06T7/90 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
地址: | 710000 陕西省西安市高新区鱼化街办*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 手镯 识别 对应 装置 | ||
1.一种模型训练方法,其特征在于,包括:
将当前批次的N个训练样本输入到图像分类模型,得到每个训练样本对应的特征向量;其中,每个训练样本包括一个目标手镯图像和对应的类别标签;
基于N个特征向量及其对应的类别标签计算当前批次的损失,所述当前批次的损失包括分类损失和辅助损失,所述分类损失表征分类预测结果与真实分类结果的差异性,所述辅助损失表征具有相同类别标签的特征向量之间的差异性以及具有不同类别标签的特征向量之间的差异性;
基于所述当前批次的损失更新所述图像分类模型的网络参数。
2.根据权利要求1所述的方法,其特征在于,所述辅助损失为Triplet损失,所述基于N个特征向量及其对应的类别标签计算当前批次的损失,包括:
利用softmax分类器将N个特征向量转化为N个概率分布,基于N个概率分布和对应的N个类别标签计算当前批次的分类损失;其中每个概率分布表征对应训练样本的分类预测结果;
基于N个特征向量及其对应的类别标签计算当前批次的Triplet损失;
将所述分类损失与所述Triplet损失进行加权求和,得到所述当前批次的损失。
3.根据权利要求2所述的方法,其特征在于,所述当前批次的N个训练样本对应K个类别,所述基于N个特征向量及其对应的类别标签计算当前批次的Triplet损失,包括:
根据所述N个训练样本的特征向量构造多个三元组[VA,VP,VN],其中,每一所述三元组中的VA为N个特征向量中的任意一个,VP为VA对应类别的训练样本的特征向量中除开VA的任意一个,VN为与VA不同类别的训练样本的特征向量中的任意一个;
计算构造的每一三元组的Triplet损失,获得多个Triplet损失;
对所述多个Triplet损失取平均值,得到所述当前批次的Triplet损失。
4.根据权利要求1-3任一项所述的方法,其特征在于,在将当前批次的N个训练样本输入到图像分类模型之前,所述方法还包括:
获取N个原始手镯图像;
对每一原始手镯图像进行背景去除处理,并截取经处理后的图像中的手镯目标,得到N个目标手镯图像。
5.根据权利要求4所述的方法,其特征在于,所述对每一原始手镯图像进行背景去除处理,包括:
利用语义分割模型对每一原始手镯图像进行识别,获得N个掩膜;
将每一原始手镯图像与对应的掩膜叠加,得到N个经处理后的图像。
6.根据权利要求4所述的方法,其特征在于,所述对每一原始手镯图像进行背景去除处理,包括:
获取预设的背景图像;
将每一原始手镯图像与所述背景图像相减,得到N个经处理后的图像。
7.一种手镯识别方法,其特征在于,包括:
获取待识别手镯图像;
对所述待识别手镯图像进行背景去除处理,并截取经处理后的图像中的手镯目标,得到目标手镯图像;
将所述目标手镯图像输入到经权利要求1-6任一项所述的方法训练得到的图像分类模型,得到对应的特征向量;
基于所述特征向量进行图像分类,获得所述待识别手镯图像的类别。
8.根据权利要求7所述的方法,其特征在于,所述对所述待识别手镯图像进行背景去除处理,包括:
利用语义分割模型对所述待识别手镯图像进行识别,获得对应的掩膜;
将所述待识别手镯图像与所述掩膜进行叠加,得到经处理后的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(西安)科技有限公司,未经创新奇智(西安)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010834303.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高速浮动打磨装置
- 下一篇:一种城市轨道车辆用高效紧急破窗装置