[发明专利]目标区域确定模型训练方法、装置和计算机可读存储介质有效
申请号: | 201910485063.3 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110287955B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 朱延东;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 区域 确定 模型 训练 方法 装置 计算机 可读 存储 介质 | ||
1.一种目标区域确定模型训练方法,其特征在于,包括:
对样本图像进行目标区域识别,得到包含所述目标区域的图像区域;
将所述图像区域缩放到固定大小,由多个所述固定大小的图像区域组成训练样本集合,并且所述训练样本集合中的图像区域被标记了多个关键点,其中,所述多个关键点位于所述目标区域内;
将所述训练样本集合输入卷积神经网络;其中,所述卷积神经网络的卷积层包含并行的多个卷积核,每个卷积核对应一个训练通道;
每个训练通道根据所述训练样本集合独立训练直至满足各自的收敛条件,得到包含多个训练通道的目标区域确定模型;其中,所述目标区域确定模型的多个训练通道分别用于预测所述多个关键点相对参照点的位移,其中,所述参照点位于所述目标区域内,所述多个关键点相对参照点的位移用于得到所述目标区域。
2.根据权利要求1所述的方法,其特征在于,所述每个训练通道根据所述训练样本集合独立训练直至满足各自的收敛条件,得到包含多个训练通道的目标区域确定模型,包括:
确定每个训练通道的参数;
每个训练通道根据确定的参数、标记的多个关键点和所述参照点计算得到预测位移;
根据每个图像区域的预测位移和真实位移确定预测误差;
重新调整所述预测误差大于预设误差对应的训练通道的参数,继续重复所述对应的训练通道的训练过程,直至所述对应的训练通道的预测误差小于或等于所述预设误差,结束所述对应的训练通道的训练过程。
3.根据权利要求1或2所述的方法,其特征在于,所述目标区域为多边形区域,所述关键点为所述多边形区域的顶点。
4.根据权利要求1或2所述的方法,其特征在于,所述参照点为所述图像区域的中心点。
5.根据权利要求1或2所述的方法,其特征在于,所述目标区域为车牌区域。
6.一种目标区域确定方法,其特征在于,包括:
对当前输入的视频帧进行目标区域识别,得到包含所述目标区域的图像区域;
将所述图像区域缩放到固定大小;
将所述固定大小的图像区域输入采用权利要求1-5任一项所述的目标区域确定模型训练方法进行训练得到的目标区域确定模型;
通过所述目标区域确定模型的多个训练通道分别预测得到多个相对参照点的位移;其中,所述参照点位于所述目标区域内;
根据所述多个相对参照点的位移和所述参照点坐标确定多个关键点;
根据所述多个关键点确定目标区域。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个关键点确定目标区域,包括:
将所述多个关键点连线形成的闭合区域作为目标区域。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取下一帧视频图像,并将所述下一帧视频图像作为所述当前输入的视频帧;
以所述图像区域为基准向四周扩大预设区域,并将扩大后的图像区域缩放成固定大小作为所述下一帧视频图像对应的包含目标区域的图像区域。
9.根据权利要求6-8任一项所述的方法,其特征在于,所述目标区域为车牌区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910485063.3/1.html,转载请声明来源钻瓜专利网。