[发明专利]目标区域确定模型训练方法、装置和计算机可读存储介质有效
申请号: | 201910485063.3 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110287955B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 朱延东;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 区域 确定 模型 训练 方法 装置 计算机 可读 存储 介质 | ||
本公开一种目标区域确定模型训练方法、装置、电子设备和计算机可读存储介质。其中方法包括:对样本图像进行目标区域识别,得到包含目标区域的图像区域;由多个固定大小的图像区域组成训练样本集合,并且训练样本集合中的图像区域被标记了多个关键点,多个关键点位于目标区域内;卷积神经网络的每个训练通道独立训练直至满足各自的收敛条件,得到包含多个训练通道的目标区域确定模型;多个训练通道分别用于预测多个关键点相对参照点的位移。本公开实施例通过并行的多个训练通道分别对训练样本集合进行训练,得到多个训练通道,多个训练通道分别用于预测多个关键点相对参照点的位移,从而根据多个关键点得到目标区域,能够提高目标区域识别准确率。
技术领域
本公开涉及一种目标区域确定模型训练技术领域,特别是涉及一种目标区域确定模型训练方法、装置和计算机可读存储介质。
背景技术
拍摄的视频图像中很多都包含汽车,而包含汽车的图像中一般都会包括车牌,由于车牌涉及到隐私,因此需要对视频图像中的车牌进行处理或者使用其他图像来覆盖该车牌。而在对包含车牌的图像进行处理时,识别出图像中的车牌区域是关键。
现有技术中对于车牌区域的识别,一般是使用模型判断车牌中的每个像素是前景还是背景,其中前景是要识别的车牌区域,背景是指图像中除了车牌外的区域。但是使用这种方法,分类器只关心像素是否为车牌中的像素,当仅使用像素是否是车牌区域的像素这一个判断条件时,容易被一些误判点影响到车牌准确区域。
发明内容
本公开解决的技术问题是提供一种目标区域确定模型训练方法,以至少部分地解决现有技术中目标区域被误判的技术问题。此外,还提供一种目标区域确定模型训练装置、目标区域确定模型训练硬件装置、计算机可读存储介质和目标区域确定模型训练终端。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定模型训练方法,包括:
对样本图像进行目标区域识别,得到包含所述目标区域的图像区域;
将所述图像区域缩放到固定大小,由多个所述固定大小的图像区域组成训练样本集合,并且所述训练样本集合中的图像区域被标记了多个关键点,其中,所述多个关键点位于所述目标区域内;
将所述训练样本集合输入卷积神经网络;其中,所述卷积神经网络的卷积层包含并行的多个卷积核,每个卷积核对应一个训练通道;
每个训练通道根据所述训练样本集合独立训练直至满足各自的收敛条件,得到包含多个训练通道的目标区域确定模型;其中,所述目标区域确定模型的多个训练通道分别用于预测所述多个关键点相对参照点的位移,其中,所述参照点位于所述目标区域内。
进一步的,所述每个训练通道根据所述训练样本集合独立训练直至满足各自的收敛条件,得到包含多个训练通道的目标区域确定模型,包括:
确定每个训练通道的参数;
每个训练通道根据确定的参数、标记的多个关键点和所述参照点计算得到预测位移;
根据每个图像区域的预测位移和真实位移确定预测误差;
重新调整所述预测误差大于预设误差对应的训练通道的参数,继续重复所述对应的训练通道的训练过程,直至所述对应的训练通道的预测误差小于或等于所述预设误差,结束所述对应的训练通道的训练过程。
进一步的,所述目标区域为多边形区域,所述关键点为所述多边形区域的顶点。
进一步的,所述参照点为所述图像区域的中心点。
进一步的,所述目标区域为车牌区域。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910485063.3/2.html,转载请声明来源钻瓜专利网。