[发明专利]神经网络及其训练方法在审
申请号: | 202010271823.3 | 申请日: | 2020-04-08 |
公开(公告)号: | CN113554042A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 张慧港;汪留安;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06T7/60 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;刘敏 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 及其 训练 方法 | ||
1.一种训练神经网络的方法,其中,所述神经网络用于图像中的对象检测并且包括骨干网络、特征网络和预测模块,所述特征网络包括第一模块和第二模块,所述方法包括:
所述骨干网络对样本图像进行处理,并且输出不同尺寸的N个第一特征;
所述特征网络的第一模块基于所述骨干网络输出的尺寸最小的第一特征执行N-1次反卷积,并且输出不同尺寸的N个第二特征;
所述特征网络的第二模块对从所述骨干网络输出的N个第一特征执行合并,并且输出不同尺寸的N个第三特征;
通过将所述N个第二特征中的每一个与所述N个第三特征中具有相同尺寸的相应一个进行组合来生成不同尺寸的N个第四特征,并且对所述N个第四特征分别执行不同次数的卷积;
所述预测模块基于所述N个第四特征进行预测,并且计算第一损失;
所述预测模块基于卷积后得到的特征进行预测,并且计算第二损失;
基于所述第一损失与所述第二损失的组合,以优化所述骨干网络、所述特征网络和所述预测模块的配置的方式来训练所述神经网络。
2.根据权利要求1所述的方法,其中,由所述特征网络的第一模块输出的N个第二特征包括所述尺寸最小的第一特征,以及每次执行反卷积后得到的特征。
3.根据权利要求1所述的方法,还包括:所述特征网络的第二模块对第i+1个第一特征执行包括双线性插值和卷积的处理,并且将第i个第一特征与经处理的第i+1个第一特征进行合并,其中i=1,2,…,N-1。
4.根据权利要求1所述的方法,其中,随着所述第四特征的尺寸增大,对其执行的卷积次数减少。
5.根据权利要求1所述的方法,其中,所述第一损失和所述第二损失中每一个均包括回归损失和分类损失。
6.根据权利要求1所述的方法,其中,所述骨干网络包括多个层,并且每个层的通道被划分为数量相等的两个部分,
所述方法还包括:对所述两个部分中的每一部分的通道执行包括卷积、通道扩张和通道缩减的处理,并且将所述两个部分的经处理的通道进行组合,以输入至下一层。
7.根据权利要求6所述的方法,还包括:
针对每个层的每一部分的通道,将经处理的通道与未经处理的通道进行相加,以获得所述部分的输出,以及
将所述两个部分的输出进行组合,以输入至所述下一层。
8.根据权利要求7所述的方法,其中,对所述两个部分中的每一部分的通道执行的处理还包括添加挤压-激励块。
9.根据权利要求8所述的方法,其中,针对所述骨干网络的每一层,以下中的至少一个是可配置的:通道扩张倍率、卷积核尺寸、是否执行经处理的通道与未经处理的通道的相加、以及是否添加挤压-激励块。
10.根据权利要求6所述的方法,所述方法还包括:
由所述骨干网络的多个层生成不同尺寸的多个特征;
选择所述多个特征中的子集,并且确定所述子集中尺寸最小的特定特征;
通过对所述特定特征进行处理,生成尺寸小于所述特定特征的一个或多个特征;
由所述子集中的特征以及尺寸小于所述特定特征的所述一个或多个特征构成所述骨干网络输出的N个第一特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010271823.3/1.html,转载请声明来源钻瓜专利网。