[发明专利]基于主动学习的目标检测模型训练方法有效

申请号：	202110769915.9	申请日：	2021-07-08
公开（公告）号：	CN113221875B	公开（公告）日：	2021-09-21
发明（设计）人：	陈映;曹松;任必为;郑翔;宋君;陶海	申请（专利权）人：	北京文安智能技术股份有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/62;G06N20/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	100094 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于主动学习目标检测模型训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种基于主动学习的目标检测模型训练方法，包括：由专家标定输入数据集向模型训练数据集输入标记有专家标签的样本图像，和/或由无标定输入数据集向模型训练数据集输入无目标对象框选的样本图像；当模型训练数据集的样本图像数量值小于或等于数据上限值时，继续训练初始模型，当样本图像数量值大于数据上限值时，选取筛除图像后训练初始模型，在筛除图像中选取无专家标签的输入待标定困难样本数据集；对其中的筛除图像进行目标对象框选筛查及专家标签标记后输入专家标定输入数据集，重复上述方案，生成目标检测模型。本发明解决了现有技术中的为了提升目标检测模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

技术领域

本发明涉及图像处理技术领域，具体而言，涉及一种基于主动学习的目标检测模型训练方法。

背景技术

目标检测是一种基于目标几何和统计特征的图像理解算法，目标检测是将目标对象的定位和识别合二为一，例如：基于计算机视觉算法，检测出图像中不同类别的目标对象，即以矩形框标注出目标的位置，并识别出目标对象的类别。

为了能够使目标检测模型适合应用于不同的环境场景，提升目标检测模型的泛化能力，在对目标检测模型训练的过程中通常不断地优化调整模型参数，达到模型精修的目的；这就需要向用于目标检测模型训练的模型训练数据集内阶段性地输入来自于不同环境场景的样本图像，而模型训练数据集的数据量不断累积会导致模型训练难度提升、训练耗时严重，不利于目标检测模型的优化训练。因此，如何提供一种能够提升目标检测模型的泛化能力，同时兼顾提高了模型训练效率的目标检测模型训练方法便成了现有技术中亟待解决的问题。

发明内容

本发明的主要目的在于提供一种基于主动学习的目标检测模型训练方法，以解决现有技术中的目标检测模型训练过程中，为了提升模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

为了实现上述目的，本发明提供了一种基于主动学习的目标检测模型训练方法，包括：步骤S1，构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ)，构造模型训练数据集(Ⅰ)用于训练初始模型，通过第一输送通道由专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像，和/或通过第二输送通道由无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像；步骤S2，获取模型训练数据集(Ⅰ)中样本图像数量值，并与模型训练数据集(Ⅰ)预先设定的数据上限值比较，当其中的样本图像数量值小于或等于数据上限值时，利用模型训练数据集(Ⅰ)继续训练初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；步骤S3，根据选取条件在模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将筛除图像取出模型训练数据集(Ⅰ)后利用模型训练数据集(Ⅰ)训练初始模型，并在筛除图像中选取至少一部分无专家标签的筛除图像归类输入待标定困难样本数据集(Ⅳ)；步骤S4，对归类输入待标定困难样本数据集(Ⅳ)中的筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ)，重复步骤S1至步骤S4，直至对初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。

进一步地，步骤S3包括：步骤S31，根据初始模型对模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算，并将至少一部分样本图像按照各自对应的损失值降序排列，以构造损失值图像序列；步骤S32，由损失值图像序列的损失值高端开始遍历损失值图像序列并顺次选取n₁个无专家标签的样本图像作为用于输入待标定困难样本数据集(Ⅳ)的困难数据样本，由损失值图像序列的损失值低端开始遍历损失值图像序列并顺次选取n₂个样本图像作为简单数据样本，其中，困难数据样本的数量n₁和简单数据样本n₂之和等于筛除图像的数量X。

进一步地，步骤S3还包括：步骤S33，对简单数据样本中的样本图像逐一判定，当其中的样本图像标记有专家标签时，归类输入专家标定简单数据集(Ⅴ)，当其中的样本图像无专家标签时，归类输入常规简单数据集(Ⅵ)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京文安智能技术股份有限公司，未经北京文安智能技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110769915.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于主动学习的目标检测模型训练方法有效

专利文献下载