[发明专利]一种基于迁移学习的少样本目标识别方法在审
申请号: | 202010195836.7 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111401454A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 张发恩;宋亮 | 申请(专利权)人: | 创新奇智(重庆)科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州鼎贤知识产权代理有限公司 44502 | 代理人: | 刘莉梅 |
地址: | 400039 重庆市九龙坡区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 样本 目标 识别 方法 | ||
本发明公开了一种基于迁移学习的少样本目标识别方法,包括:确定一源域模型作为目标域初始模型;目标域初始模型对输入的源域数据D1和目标域数据D2进行预测,得到关联源域数据D1的特征向量F1和关联目标域数据D2的特征向量F2;目标域初始模型分别对特征向量F1和特征向量F2进行分类,得到一分类结果;基于分类结果与真实分类结果间的差异,确定目标域初始模型的损失函数L;基于损失函数L,并通过优化算法对目标域初始模型进行模型优化,最终训练形成一目标域模型。本发明解决了现有的预测模型由于没有充足的训练样本而无法对少样本商品进行分类预测的技术问题。
技术领域
本发明涉及深度学习技术领域,具体涉及一种基于迁移学习的少样本目标识别方法。
背景技术
如今,深度学习技术在各行各领域得到了广泛应用。但深度学习过程需要大量的标注数据训练预测模型,但在一些特定的应用场景中很难收集到有效的训练数据,比如在新零售领域,一些新款产品在上市前期通常不会发布产品细节图,所以很难找到这些新款产品的图片数据。但此时如果需要通过深度学习技术对新款产品进行识别,由于缺乏新款产品的图片数据,所以无法获取识别模型的训练样本,也就无法通过深度学习技术对该些新款产品进行高效率、高准确率的预测识别。这种情况下,商品识别需求方不得不通过传统的计算机视觉识别方法甚至是人工识别的方法对新款产品进行识别,这样的识别方式识别成本较高,而且识别效率低下,识别准确率也不高。
发明内容
本发明的目的在于提供一种基于迁移学习的少样本目标识别方法,以解决上述技术问题。
为达此目的,本发明采用以下技术方案:
提供一种基于迁移学习的少样本目标识别方法,包括如下步骤:
步骤S1,确定一源域模型作为目标域初始模型;
步骤S2,所述目标域初始模型对输入的源域数据D1和目标域数据D2进行预测,得到关联所述源域数据D1的特征向量F1和关联所述目标域数据D2的特征向量F2;
步骤S3,所述目标域初始模型分别对所述特征向量F1和所述特征向量F2进行分类,得到一分类结果;
步骤S4,基于所述分类结果与真实分类结果间的差异,确定所述目标域初始模型的损失函数L;
步骤S5,基于所述损失函数L,并通过优化算法对所述目标域初始模型进行模型优化;
步骤S6,重复所述步骤S2~S5,对所述目标域初始模型进行迭代更新,最终训练形成一目标域模型。
作为本发明的一种优选方案,所述步骤S4中,所述损失函数L包括第一损失函数L1和第二损失函数L2,所述第一损失函数L1为所述目标域初始模型对所述特征向量F1作出的预测类别P1与所述特征向量F1对应的真实类别Y1的交叉熵;
所述第二损失函数L2为所述目标域初始模型对所述特征向量F2作出的预测类别P2与所述特征向量F2对应的真实类别Y2的交叉熵。
作为本发明的一种优选方案,所述步骤S4中,所述损失函数L包括第三损失函数L3,所述第三损失函数L3为针对所述特征向量F1和所述特征向量F2间的距离所计算的距离值。
作为本发明的一种优选方案,所述距离为欧氏距离。
作为本发明的一种优选方案,所述步骤S5中,通过SGD随机梯度下降优化算法对所述目标域初始模型进行模型优化。
作为本发明的一种优选方案,所述源域模型包括ResNet50和ResNet101预训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(重庆)科技有限公司,未经创新奇智(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195836.7/2.html,转载请声明来源钻瓜专利网。