[发明专利]神经网络训练方法、设备及计算机可读介质在审
申请号: | 202110813756.8 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113537491A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 姚广;苏仲岳;闫正 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;邵栋 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 设备 计算机 可读 介质 | ||
1.一种神经网络训练方法,其特征在于,该方法包括:
训练第一神经网络,并在训练完成后固定所述第一神经网络的参数;
将训练图片进行分形处理,获取包括四个旋转角度的所述训练图片的输入图片,并将所述输入图片输入所述第一神经网络,获取第一特征信息、第二特征信息、第三特征信息和第四特征信息,所述四个旋转角度分别为0°、90°、180°和270°,所述第一特征信息表示旋转角度为0°的训练图片的图像特征,所述第二特征信息表示旋转角度为90°的训练图片的图像特征,所述第三特征信息表示旋转角度为180°的训练图片的图像特征,所述第四特征信息表示旋转角度为270°的训练图片的图像特征;
将输入图片输入第二神经网络的编码器进行编码,获取编码特征信息,并将所述编码特征信息和第一特征信息输入第二神经网络的解码器进行解码,获取第二解码特征信息、第三解码特征信息和第四解码特征信息;
根据第二解码特征信息、第三解码特征信息和第四解码特征信息以及第二特征信息、第三特征信息和第四特征信息,训练所述第二神经网络,以更新所述第二神经网络的参数,使得所述第二解码特征信息、第三解码特征信息和第四解码特征信息分别逼近所述第二特征信息、第三特征信息和第四特征信息;
固定所述编码器的参数,训练所述第二神经网络的编码器,以更新所述编码器的参数。
2.根据权利要求1所述的方法,其特征在于,所述编码器采用网络深度小于预设值的卷积神经网络,所述解码器包括全连接层和标准化层。
3.根据权利要求1所述的方法,其特征在于,根据第二解码特征信息、第三解码特征信息和第四解码特征信息以及第二特征信息、第三特征信息和第四特征信息,训练所述第二神经网络的编码器,以更新所述编码器的参数,使得所述第二解码特征信息、第三解码特征信息和第四解码特征信息分别逼近所述第二特征信息、第三特征信息和第四特征信息,包括:
使用均方损失函数更新所述神经网络的参数,使得所述第二解码特征信息、第三解码特征信息和第四解码特征信息分别与所述第二特征信息、第三特征信息和第四特征信息之间的差异小于预设值。
4.根据权利要求1所述的方法,其特征在于,训练第一神经网络,包括:
将训练图片进行分形处理,获取包括四个旋转角度的所述训练图片的输入图片,所述四个旋转角度分别为0°、90°、180°和270°;
将所述输入图片输入所述神经网络进行前向传播,获取所述输入图片对应的第一特征信息、第二特征信息、第三特征信息和第四特征信息,所述第一特征信息表示旋转角度为0°的训练图片的图像特征,所述第二特征信息表示旋转角度为90°的训练图片的图像特征,所述第三特征信息表示旋转角度为180°的训练图片的图像特征,所述第四特征信息表示旋转角度为270°的训练图片的图像特征;
根据所述输出特征信息计算对应于不同旋转角度的损失函数值,并根据所述损失函数值计算梯度,进行反向传播以更新所述神经网络的参数;
重复进行所述前向传播和反向传播,直至所述神经网络收敛。
5.根据权利要求4所述的方法,其特征在于,将训练图片进行分形处理,获取包括四个旋转角度的所述训练图片的输入图片,所述四个旋转角度分别为0°、90°、180°和270°,包括:
将同一训练图片分别旋转90°、180°和270°,以获得旋转角度为90°、180°和270°的训练图片;
将未进行旋转的训练图片与所述旋转角度为90°、180°和270°的训练图片进行组合,获得包括四个旋转角度的所述训练图片的输入图片,所述四个旋转角度分别为0°、90°、180°和270°。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110813756.8/1.html,转载请声明来源钻瓜专利网。