[发明专利]一种适合卷积神经网络模型的dropout方法在审
申请号: | 201910354717.9 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110070180A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 高岩;于治楼;姜凯;李锐;李朋 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 特征图 中心点 矩阵 人工智能技术 区域矩形 初始化 多尺度 鲁棒性 遮罩 | ||
1.一种适合卷积神经网络模型的dropout方法,其特征在于,
首先根据伯努利分布初始化一个特征图的遮罩矩阵的中心点,然后根据中心点生成多尺度区域矩形,最后对区域内的特征图进行dropout。
2.根据权利要求1所述的方法,其特征在于,
主要包括如下几个步骤
1)每个卷积层激活特征图生成遮罩mask;
2)针对卷积神经网络模型的多尺度空间dropout;
3)使用MSSDropout方法训练神经网络模型。
3.根据权利要求1所述的方法,其特征在于,
根据特征图宽度、高度和通道数建立一个相同大小的遮罩,然后对遮罩进行初始化,采用伯努利分布对每个位置进行赋值。
4.根据权利要求3所述的方法,其特征在于,
初始化完毕后,遮罩上每个位置的值被设定为0或1;0表示该位置对应的特征图上的特征值将被dropout,否则保留。
5.根据权利要求4所述的方法,其特征在于,
以遮罩上每个为零的位置进行扩展。
6.根据权利要求5所述的方法,其特征在于,
首先设置一个扩展后的矩形区域面积与特征图原始面积的比例列表作为候选比例;
然后将每个为零的位置设置为一个矩形区域的中心,随机选取一个候选比例值得到遮罩上矩形的长度和高度,将遮罩上该矩形区域内的所有值重新复制为0;
操作完成后,原来遮罩上数个零散为零的点将变成数个分布在遮罩上为零的矩形区域;
将遮罩上的每个位置上的值与特征图上每个位置上的值进行乘法运算,得到dropout之后的特征图。
7.根据权利要求6所述的方法,其特征在于,
最后,将MSSDropout方法应用到整个卷积神经网络模型。
8.根据权利要求7所述的方法,其特征在于,
在训练阶段,首先为每个需要进行dropout的卷积层设定伯努利分布超参数;卷积层计算得到输出的特征图之后进行dropout,得到dropout之后的特征图,然后进行激活运算,传输给下一层。
9.根据权利要求8所述的方法,其特征在于,
在推理阶段,将遮罩上每个位置为零的概率设置为0即可屏蔽掉dropout运算,或者直接移除掉或跳过dropout。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910354717.9/1.html,转载请声明来源钻瓜专利网。