[发明专利]一种基于多模型融合的特征蒸馏方法、系统、设备和介质在审
申请号: | 202210142194.3 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114462546A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 王曦;蹇易 | 申请(专利权)人: | 上海云从企业发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/80;G06V10/74;G06V10/771 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 张双凤 |
地址: | 201203 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 融合 特征 蒸馏 方法 系统 设备 介质 | ||
1.一种基于多模型融合的特征蒸馏方法,其特征在于,包括:
通过预训练的多个教师模型分别获取目标数据的特征作为第一特征;
通过学生模型的主干网络获取所述目标数据的第二特征,将所述第二特征分别输入多个第一蒸馏子网络,通过每个所述第一蒸馏子网络分别输出与所述第一特征相似度达到设定阈值的第二特征;
将所有所述第一特征进行融合得到第一融合特征,并将各所述蒸馏子网络输出的第二特征进行融合得到第二融合特征,将所述第一融合特征和第二融合特征输入第二蒸馏子网络,获取所述目标数据的蒸馏特征。
2.根据权利要求1所述的基于多模型融合的特征蒸馏方法,其特征在于,所述第一蒸馏子网络包括:注意力模块、归一化层、相似计算层以及至少一个全连接层;
注意力模块根据所述全连接层输出特征的特征值大小获取对应特征的权重输出至所述归一化层;
所述归一化层根据所述全连接层输出特征以及所述注意力模块输出权重完成对应特征归一化;
所述相似计算层通过预设的损失函数获取归一化后的特征与对应教师模型输出的第一特征之间的相似度。
3.根据权利要求2所述的基于多模型融合的特征蒸馏方法,其特征在于,所述注意力模块通过映射函数将特征值映射到-1至1之间。
4.根据权利要求3所述的基于多模型融合的特征蒸馏方法,其特征在于,所述映射函数包括:softmax函数、sigmoid函数。
5.根据权利要求1所述的基于多模型融合的特征蒸馏方法,其特征在于,所述第二蒸馏子网络与所述第一蒸馏子网络采用相同的网络结构。
6.根据权利要求1所述的基于多模型融合的特征蒸馏方法,其特征在于,将所述第一融合特征和第二融合特征输入第二蒸馏子网络之前,还包括:
对所述第一融合特征采用降维算法进行降维处理。
7.根据权利要求1所述的基于多模型融合的特征蒸馏方法,其特征在于,所述第一蒸馏子网络的数量与所述教师模型的数量相对应,且每个第一蒸馏子网络分别接收一个所述教师模型的第一特征。
8.一种基于多模型融合的特征蒸馏系统,其特征在于,包括:
第一特征获取模块,用于通过预训练的多个教师模型分别获取目标数据的特征作为第一特征;
学生特征获取模块,用于通过学生模型的主干网络获取所述目标数据的第二特征,将所述第二特征分别输入多个第一蒸馏子网络,通过每个所述第一蒸馏子网络分别输出与所述第一特征相似度达到设定阈值的第二特征;
融合蒸馏模块,用于将所有所述第一特征进行融合得到第一融合特征,并将各所述蒸馏子网络输出的第二特征进行融合得到第二融合特征,将所述第一融合特征和第二融合特征输入第二蒸馏子网络,获取所述目标数据的蒸馏特征。
9.一种设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-7中一个或多个所述的方法。
10.一种机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-7中一个或多个所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海云从企业发展有限公司,未经上海云从企业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210142194.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种马铃薯芽眼识别方法及设备
- 下一篇:一种代码生成方法、装置及终端设备