[发明专利]用于目标检测的神经网络训练方法、装置、设备、介质有效
申请号: | 201910523611.7 | 申请日: | 2019-06-17 |
公开(公告)号: | CN110263842B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 宋波 | 申请(专利权)人: | 北京影谱科技股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 杜立军;孙志一 |
地址: | 100027 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 目标 检测 神经网络 训练 方法 装置 设备 介质 | ||
1.一种用于目标检测的神经网络训练方法,其特征在于,包括:
S1:将检测目标图像输入teacher网络、student网络;
S2:将所述student网络的基础网络第四层的通道数量扩充到与所述teacher网络的基础网络第四层的通道数量相同;所述teacher网络中的基础网络第四层的第一特征值、所述student网络中的基础网络第四层的扩充后的第二特征值输入到L2 Loss函数;将所述student网络的RPN网络、FasterRCNN头部分类网络接入所述检测目标图像的矩形框以及对应的检测类别;将所述L2 Loss、所述RPN网络的标准Loss函数和FasterRCNN头部分类网络的标准Loss函数的结果确定为比对结果,对所述student网络的基础网络、所述RPN网络和所述FasterRCNN头部分类网络同时进行反向传播训练;
S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;
其中,所述student网络包括基础网络、RPN网络、FasterRCNN头部分类网络;所述teacher网络的基础网络与所述student网络的基础网络总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的基础网络的通道数比所述student网络的基础网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。
2.根据权利要求1所述的神经网络训练方法,其特征在于,所述L2 Loss函数为:s为teacher网络中的基础网络第四层的第一特征值;t为student网络中的基础网络第四层的第二特征值;r(t)为student网络中的基础网络第四层的扩充后的第二特征值;所述N为s-r(t)的元素个数。
3.一种用于目标检测的神经网络训练装置,其特征在于,包括:
目标图像输入模块,用于实现步骤S1:将检测目标图像输入teacher网络、student网络;
特征比较模块,包括:通道调整单元,用于将所述student网络的基础网络第四层的通道数量扩充到与所述teacher网络的基础网络第四层的通道数量相同;特征值输入单元,用于所述teacher网络中的基础网络第四层的第一特征值、所述student网络中的基础网络第四层的扩充后的第二特征值输入到L2Loss函数;
FasterRCNN网络接入模块,用于将所述student网络的RPN网络、FasterRCNN头部分类网络接入所述检测目标图像的矩形框以及对应的检测类别;
网络损失计算模块,用于将所述L2 Loss、所述RPN网络的标准Loss函数和FasterRCNN头部分类网络的标准Loss函数的结果确定为比对结果,对所述student网络的基础网络、所述RPN网络和所述FasterRCNN头部分类网络同时进行反向传播训练;
网络调整模块,用于实现步骤S3:利用所述比对结果,对所述student网络进行调整,并进入步骤S2,直到得到的比对结果小于预设阈值,以得到训练后的student网络;
其中,所述student网络包括基础网络、RPN网络、FasterRCNN头部分类网络;所述teacher网络的基础网络与所述student网络的基础网络总体构架相同;所述teacher网络处于前向预测模式,所述student网络处于训练模式;所述teacher网络的通道数比所述student网络的通道数多;所述检测目标图像,设有检测目标的矩形框以及所述检测目标的标签类别。
4.根据权利要求3所述的神经网络训练装置,其特征在于,所述L2 Loss函数为:s为teacher网络中第四层的第一特征值;t为student网络中的第四层的第二特征值;r(t)为student网络中的第四层的扩充后的第二特征值;所述N为s-r(t)的元素个数。
5.一种用于目标检测的神经网络训练设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至2任一项所述用于目标检测的神经网络训练方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至2任一项所述用于目标检测的神经网络训练方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京影谱科技股份有限公司,未经北京影谱科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910523611.7/1.html,转载请声明来源钻瓜专利网。