[发明专利]模型训练方法、可读介质和电子设备有效
申请号: | 202111657195.3 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114972725B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 傅蓉蓉;徐晓忻;黄全充;徐强;纪荣嵘;周奕毅;曹刘娟 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06N3/091;G06N3/0895;G06N3/0464 |
代理公司: | 上海音科专利商标代理有限公司 31267 | 代理人: | 夏峰 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 可读 介质 电子设备 | ||
1.一种基于图像的目标检测模型训练方法,用于电子设备,其特征在于,包括:
采用第一图像集合对第一模型进行训练得到第二模型,其中所述第一图像集合包括A%的有标签样本和B%的伪标签样本,其中B%的伪标签样本是所述第一模型对C%的无标签样本进行预测得到的,并且B%小于或者等于C%;
将所述C%的无标签样本输入所述第二模型,得到对应各无标签样本的模型输出结果,所述各无标签样本的模型输出结果为:采用所述第二模型对所述C%的无标签样本进行目标检测得到的对应各无标签样本的目标检测结果;
从所述C%的无标签样本中选择出模型输出结果满足预设条件的D%的无标签样本;
利用第二图像集合对所述第二模型进行训练得到第三模型,其中,所述第二图像集合包括将D%的无标签样本标注后的D%的有标签样本、所述A%的有标签样本、E%的伪标签样本,其中E%的伪标签样本是所述第二模型对(C-D)%的无标签样本进行预测得到的,并且E%小于或者等于(C-D)%;每个样本均为一张图像,所述第三模型用于图像目标检测。
2.根据权利要求1所述的方法,其特征在于,并且,
所述从所述C%的无标签样本中选择出模型输出结果满足预设条件的D%的无标签样本,包括:
基于所述各无标签样本的目标检测结果,对所述C%的无标签样本进行评分,得到对应所述C%的无标签样本中各无标签样本的评分结果;
根据所述各无标签样本的评分结果,按照评分从高到低的顺序从所述C%的无标签样本中选择出D%的无标签样本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述各无标签样本的目标检测结果,对所述C%的无标签样本进行评分,得到对应所述C%的无标签样本中各无标签样本的评分结果,包括:
基于所述各无标签样本的目标检测结果,计算出所述C%的无标签样本中各无标签样本的不确定分数、信息量分数以及多样性分数;
基于计算出的所述C%的无标签样本中各无标签样本的不确定分数、信息量分数以及多样性分数,计算出所述C%的无标签样本中各无标签样本的价值分数;
将所述C%的无标签样本中各无标签样本的价值分数分别作为对应所述C%的无标签样本中各无标签样本的评分结果。
4.根据权利要求3所述的方法,其特征在于,所述方法包括:通过以下公式计算出所述C%的无标签样本中各无标签样本的价值分数Si:
其中,Si为所述C%的无标签样本中第i个样本的价值分数;为所述C%的无标签样本中第i个样本的不确定性分数;为所述C%的无标签样本中第i个样本的信息量分数;为所述C%的无标签样本中第i个样本的多样性分数;β1为所述不确定性分数的权重;β2为所述信息量分数的权重;β3为所述多样性分数的权重。
5.根据权利要求2至4中任一项所述的方法,其特征在于,
所述各无标签样本的目标检测结果包括:所述各无标签样本中各目标框的位置、各目标框的分类概率分布、各目标框的类别、各目标框的置信度中的至少一种。
6.根据权利要求5所述的方法,其特征在于,所述方法包括:通过以下公式计算出所述C%的无标签样本中第i个样本的不确定性分数
其中,是所述C%的无标签样本中第i个样本中的目标框数目;
p(ck;bj,θt)是所述C%的无标签样本中第i个样本中各目标框内的目标是第k类目标的预测概率;
Nc是所述C%的无标签样本中第i个样本中包含的目标种类的数目;
αk是所述C%的无标签样本中第i个样本中的各目标框内的目标是第k类目标的预测概率的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111657195.3/1.html,转载请声明来源钻瓜专利网。