[发明专利]一种用于点云目标检测模型的压缩方法有效
申请号: | 202010243264.5 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461212B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李超;孙飞;徐勇军;许建荣 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/774;G06V10/764;G06V10/766;G06V10/82;G06N3/045;G06N3/082;G06N3/091;G06N3/096 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 目标 检测 模型 压缩 方法 | ||
1.一种用于点云目标检测模型的压缩方法,其特征在于,所述模型的压缩方法包括:
S1、以原始的点云目标检测模型为教师模型,其中,教师模型包括依次连接的骨干网络、分类网络、回归网络,对教师模型的骨干网络进行裁剪或替换获得规模小于教师模型的初始学生模型;
S2、将教师模型训练至收敛,用收敛后的教师模型对点云数据进行处理,其中,教师模型的骨干网络输出特征矩阵、教师模型的分类网络的输出软极大值、教师模型的回归网络生成前景点对应的检测框;
S3、以教师模型骨干网络输出的特征矩阵为标签,对初始学生模型的骨干网络进行训练;
S4、以教师模型的分类网络输出的软极大值为标签,对完成骨干网络训练的学生模型的分类网络进行训练;其中,训练所使用的损失函数为:
Lcls=μLhard+(1-μ)Lsoft(Ps-Pt)
Lsoft=-∑Ptlog Ps
其中,Lcts表示学生模型分类网络的损失函数,Lhard为交叉熵损失,表示直接使用真实的分类标签对学生模型的分类网络进行训练的损失,Lsoft表示根据教师模型的分类网络输出的软极大值计算的损失,Ps表示教师模型的分类网络输出的软极大值,Pt表示学生模型的分类网络输出的软极大值,μ为分类损失调节因子;
S5、用教师模型的回归网络中前景点生成的检测框对完成分类网络训练的学生模型的回归网络进行训练;其中,训练所使用的损失函数如下:
其中,Lreg表示学生模型回归网络的损失函数,LsL1(Rs,ygt)为L1损失,表示使用真实的检测框对学生模型训练的损失,Rs表示学生模型回归网络的输出,ygt表示真实的检测框标签;Lkd(Rs,Rt)为L2损失,N表示从教师模型回归网络输出的检测框中选取的检测框总数,u(i)为教师网络输出的第i个前景点生成的检测框的值,v(i)为学生模型输出的对应前景点生成的检测框的值,为回归损失调节因子;
S6、将完成骨干网络训练、分类网络训练、回归网络训练的学生模型训练至收敛得到压缩模型。
2.根据权利要求1所述的用于点云目标检测模型的压缩方法,其特征在于,所述步骤S2中将教师模型训练至收敛包括:将教师模型进行多次训练,直到在某次训练后与该次训练前相比,其分类准确率的变化范围小于或等于0.01%,判定该教师模型已训练至收敛。
3.根据权利要求1所述的用于点云目标检测模型的压缩方法,其特征在于,所述步骤S3中,使用如下损失函数对学生模型的骨干网络进行训练:
LHT=||uh(x)-r(vg(x))||2
其中,x表示点云数据,uh(x)表示教师模型对点云数据进行处理后骨干网络的输出,vg(x)表示学生模型的骨干网络的输出,r表示归一化函数,LHT表示教师模型骨干网络输出与学生模型骨干网络输出之间的L2损失。
4.根据权利要求3所述的用于点云目标检测模型的压缩方法,其特征在于,所述分类损失调节因子取值范围为[0,1]。
5.据权利要求4所述的用于点云目标检测模型的压缩方法,其特征在于,所述回归损失调节因子取值范围为[0,1]。
6.一种用于点云目标检测的边缘设备,包括存储器和处理器,其特征在于,
所述存储器上部署有基于权利要求1至5中任一所述方法获得的学生模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010243264.5/1.html,转载请声明来源钻瓜专利网。