[发明专利]目标检测模型的训练及身份验证方法和装置在审
申请号: | 202111374762.4 | 申请日: | 2021-11-17 |
公开(公告)号: | CN113902041A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 李钢;王宇杰 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/08;G06N3/04 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 身份验证 方法 装置 | ||
本公开实施例提供一种目标检测模型的训练及身份验证方法和装置,通过采用两个模型之间的预测差异对两个模型之间的特征差异进行加权处理,得到加权特征差异,再基于加权特征差异对所述第一目标检测模型进行训练,使得两个模型之间的特征差异与预测差异呈正相关,因此,能够通过使第一目标检测模型学习第二目标检测模型的特征提取能力,来提高第一目标检测模型的目标检测准确度。
技术领域
本公开涉及计算机视觉技术领域,尤其涉及目标检测模型的训练及身份验证方法和装置。
背景技术
知识蒸馏(Knowledge Distillation,KD)是指利用已经训练好的教师模型获取的信息来对学生模型进行训练。在目标检测应用场景下,一般通过使学生模型学习教师模型的特征提取能力来对学生模型进行训练。然而,通过上述方式训练得到的学生模型的目标检测准确度较低。
发明内容
第一方面,本公开实施例提供一种目标检测模型的训练方法,所述方法包括:将样本图像分别输入第一目标检测模型和训练好的第二目标检测模型,所述第一目标检测模型为学生模型,所述第二目标检测模型为教师模型;获取所述第一目标检测模型的各个网络层输出的第一特征图以及所述第二目标检测模型的对应网络层输出的第二特征图之间的特征差异;获取所述第一目标检测模型的各个网络层输出的第一预测结果图以及所述第二目标检测模型的对应网络层输出的第二预测结果之间的预测差异,一个网络层输出的预测结果用于表征所述网络层输出的特征图上各个点的类别;基于每个网络层对应的预测差异对所述每个网络层对应的特征差异进行加权处理,得到所述每个网络层的加权特征差异;基于各个网络层的加权特征差异对所述第一目标检测模型进行训练。
在一些实施例中,所述基于各个网络层的加权特征差异对所述第一目标检测模型进行训练,包括:对各个网络层的加权特征差异进行求和,得到所述第一目标检测模型与所述第二目标检测模型之间的总特征差异;基于所述总特征差异建立第一损失函数,基于第一损失函数对所述第一目标检测模型进行训练。
在一些实施例中,所述基于所述第一损失函数对所述第一目标检测模型进行训练,包括:针对预先确定的多个锚框,获取所述第一目标检测模型为所述样本图像确定的所述多个锚框中每个锚框的第一分值,并获取所述第二目标检测模型为所述样本图像确定的所述每个锚框的第二分值,一个锚框的分值用于表征将所述锚框内的对象划分为所述样本对象的真实类别的置信度;基于各个锚框的第一分值与第二分值之间的差异建立第二损失函数;基于所述第一损失函数和第二损失函数对所述第一目标检测模型进行训练。
在一些实施例中,所述基于所述第一损失函数和第二损失函数对所述第一目标检测模型进行训练,包括:对所述第一损失函数和所述第二损失函数进行加权求和,得到总损失函数;基于总损失函数对第一目标检测模型进行训练。
在一些实施例中,所述基于每个网络层对应的预测差异对所述每个网络层对应的特征差异进行加权处理,得到所述每个网络层的加权特征差异,包括:对所述每个网络层对应的预测差异中的每个元素与所述每个网络层对应的特征差异中的对应元素进行逐元素相乘,得到相乘结果;对各元素对应的相乘结果进行相加,得到所述每个网络层的加权特征差异。
在一些实施例中,所述获取所述第一目标检测模型的各个网络层输出的第一特征图以及所述第二目标检测模型的对应网络层输出的第二特征图之间的特征差异,包括:针对每个网络层,获取所述第一目标检测模型的所述网络层输出的第一特征图与所述第二目标检测模型的所述网络层输出的第二特征图在各个通道上的特征差异;对各个通道上的特征差异进行求和,得到所述网络层的特征差异。
在一些实施例中,所述获取所述第一目标检测模型的各个网络层输出的第一预测结果图以及所述第二目标检测模型的对应网络层输出的第二预测结果之间的预测差异,包括:针对每个网络层,获取所述第一目标检测模型的所述网络层输出的各类别对应的第一预测结果以及所述第二目标检测模型的所述网络层输出的各类别对应的第二预测结果;对各类别对应的第一预测结果与第二预测结果之间的差异求和,得到所述网络层的预测差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111374762.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力无线接入专网异常流量检测方法
- 下一篇:食品包装机