[发明专利]卷积神经网络模型训练方法、装置和计算机可读存储介质有效
申请号: | 201910485052.5 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110288082B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 朱延东;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 安凯 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 模型 训练 方法 装置 计算机 可读 存储 介质 | ||
本公开一种卷积神经网络模型训练方法、装置、电子设备和计算机可读存储介质。其中方法包括:将卷积神经网络分为多个卷积阶段;其中卷积阶段由至少一个卷积层组成;确定卷积神经网络的参数;将正训练样本集合输入卷积神经网络进行训练,得到每个样本图像对应的多个卷积阶段的特征图像;针对每个样本图像,将对应的多个卷积阶段的特征图像进行融合;根据每个样本图像融合后的特征图像得到正样本卷积神经网络模型;其中,所述正样本卷积神经网络模型用于识别目标区域。本公开实施例在正样本卷积神经网络模型训练的过程中融合卷积神经网络多个卷积阶段的特征图像,可以提高正样本卷积神经网络模型对目标区域的正确识别率。
技术领域
本公开涉及一种卷积神经网络模型训练技术领域,特别是涉及一种卷积神经网络模型训练方法、装置和计算机可读存储介质。
背景技术
拍摄的视频图像中很多都包含汽车,而包含汽车的图像中一般都会包括车牌,由于车牌涉及到隐私,因此需要对视频图像中的车牌进行处理或者使用其他图像来覆盖该车牌。而在对包含车牌的图像进行处理时,识别出图像中的车牌区域是关键。
在现有技术中,通常使用直筒型的网络来训练模型,采用训练得到的模型对图像中的车牌区域进行识别,这样最终识别出来的车牌区域的边缘非常模糊,不能精确定位车牌的轮廓。另外针对一些类似车牌的区域,例如蓝底色的标志等等,有可能会被误判为车牌。
发明内容
本公开解决的技术问题是提供一种卷积神经网络模型训练方法,以至少部分地解决现有技术中无法实现高速读写数据并能实现持久化的技术问题。此外,还提供一种卷积神经网络模型训练装置、卷积神经网络模型训练硬件装置、计算机可读存储介质和卷积神经网络模型训练终端。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种卷积神经网络模型训练方法,包括:
对卷积神经网络的多个卷积层进行分割,得到多个卷积阶段;其中所述多个卷积层依次串联;
确定所述卷积神经网络的参数;
将正训练样本集合输入所述卷积神经网络进行训练,得到每个样本图像对应的多个卷积阶段的特征图像;其中,所述正训练样本集合由多个标记了目标区域的样本图像组成;
针对每个样本图像,将对应的多个卷积阶段的特征图像进行融合;
根据所述每个样本图像融合后的特征图像得到正样本卷积神经网络模型;其中,所述正样本卷积神经网络模型用于识别所述目标区域。
进一步的,所述根据所述每个样本图像融合后的特征图像得到正样本卷积神经网络模型,包括:
针对每个样本图像,通过所述卷积神经网络的输出层对融合后的特征图像进行识别,得到预测目标区域;
根据所有样本图像的预测目标区域和对应的样本图像中包含的真实目标区域确定预测误差;
若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到所述正样本卷积神经网络模型。
进一步的,所述方法还包括:
将验证样本集合输入所述正样本卷积神经网络模型进行识别,得到验证样本图像的预测目标区域;其中,验证样本集合由多个标记了目标区域的验证样本图像组成;
若根据所有验证样本图像的预测目标区域和对应的验证样本图像中包含的真实目标区域确定的预测误差小于或等于预设误差,则确定所述正样本卷积神经网络模型通过验证,否则,重新确定所述卷积神经网络的参数,继续训练直到得到的正样本卷积神经网络模型通过验证。
进一步的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910485052.5/2.html,转载请声明来源钻瓜专利网。