[发明专利]一种目标检测模型的训练方法在审
申请号: | 202010707915.1 | 申请日: | 2020-07-22 |
公开(公告)号: | CN112036434A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 冯落落;李锐;金长新 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 董延丽 |
地址: | 250100 山东省济南*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 模型 训练 方法 | ||
1.一种目标检测模型的训练方法,其特征在于,所述方法包括:
获取预先训练的第一模型与第二模型,所述第一模型包括处理模块,其中,所述处理模块包括DWConv以及PWConv,所述第二模型包括VGG16模块;
根据所述第一模型与所述第二模型,确定出初始的目标检测模型;
根据第一数据集训练所述初始的目标检测模型,确定出符合条件的目标检测模型。
2.根据权利要求1所述的目标检测模型的训练方法,其特征在于,获取预先训练的所述第一模型与所述第二模型之前,所述方法还包括:
构建初始的第一模型;
根据第二数据集训练所述初始的第一模型,确定出符合条件的第一模型。
3.根据权利要求2所述的目标检测模型的训练方法,其特征在于,所述第一模型包括卷积层、池化层以及全连接层,其中,所述第一模型的卷积层包括卷积模块与多个处理模块。
4.根据权利要求3所述的目标检测模型的训练方法,其特征在于,所述卷积模块包括多个3x3Conv;所述处理模块包括多个3x3DWConv与多个1x1PWConv。
5.根据权利要求4所述的目标检测模型的训练方法,其特征在于,所述处理模块的处理过程具体包括:
接收预设尺寸的图片,将所述图片输入至3个3X3的DWConv进行卷积操作,得到第一特征图;
对所述第一特征图使用32个1X1的PWConv进行卷积操作,得到第二特征图;
对所述第二特征图使用32个3X3的DWConv进行卷积操作,得到第三特征图;
将所述第二特征图与所述第三特征图进行堆叠操作,得到第四特征图。
6.根据权利要求3所述的目标检测模型的训练方法,其特征在于,所述根据所述第一模型与所述第二模型,确定出初始的目标检测模型,具体包括:
将预先训练的所述第一模型中所述卷积层进行保存,并将所述池化层与所述全连接层删除;
将删除所述池化层与所述全连接层的第一模型替换所述第二模型的VGG16模块,确定出初始的目标检测模型。
7.根据权利要求6所述的目标检测模型的训练方法,其特征在于,所述根据第一数据集训练所述初始的目标检测模型,确定出符合条件的目标检测模型之前,所述方法还包括:
将所述第一模型中预设层的卷积权重进行固定。
8.根据权利要求3所述的目标检测模型的训练方法,其特征在于,所述全连接层设置有三个,三个全连接层的神经元个数分别为4096、4096以及1000。
9.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述根据第一数据集训练所述初始的目标检测模型,确定出符合条件的目标检测模型之后,所述方法还包括:
将目标图像输入至预先训练的目标检测模型;
根据所述目标检测模型确定出目标图像的检测结果。
10.根据权利要求1-9任一项所述的目标检测模型的训练方法,其特征在于,所述第二模型为Faster RCNN模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010707915.1/1.html,转载请声明来源钻瓜专利网。