[发明专利]一种训练方法、装置、设备和存储介质有效
申请号: | 202011324849.6 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112132239B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王学彬 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 方法 装置 设备 存储 介质 | ||
本申请提供了一种训练方法、装置、设备和存储介质,其中,该方法包括:使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果;根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的各图像的样本类型;按照预设的第一样本类型比例,从所述第一样本和所述第二样本中选择图像,以将选择出来的图像作为第一训练样本;使用第一训练样本对所述待训练分类器进行模型训练,通过上述方法有利于提高待训练分类器的分类性能,以及有利于提高待训练分类器的分类准确率。
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种训练方法、装置、设备和存储介质。
背景技术
图像分类器能够对图像进行分类,图像分类器在图像领域有着重要的应用。图像分类器的分类性能的高低与训练数据息息相关,在对图像分类器进行训练时,需要使用大量的训练数据,并且在对图像分类器进行训练之前,需要对训练数据进行人工标注,而人工标注的方式使得训练效率大大降低。
为了提高训练效率,目前使用半监督的方式对图像分类器进行训练,例如:在获取到训练数据后,使用人工的方式对一小部分训练数据进行标注,然后使用标注后的训练数据对图像分类器进行训练,在完成训练后,使用训练后的图像分类器对未进行标注的训练数据进行分类,然后从分类结果中再选择一部分数据作为训练数据对图像分类器继续进行训练,直至图像分类器符合要求。
对于半监督的训练方式,由于图像分类器所使用的训练数据中可能包括错误的训练数据,从而使得训练后的图像分类器对不能正确识别的图像仍不能正确识别,并且还会降低图像分类器的对该类图像的分类性能,从而降低了图像分类器的分类准确率。
发明内容
有鉴于此,本申请实施例提供了一种训练方法、装置、设备和存储介质,以提高图像分类器的分类准确率。
第一方面,本申请实施例提供了一种训练方法,包括:
使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果,其中,所述待训练分类器的分类类别数量为K,K为正整数;
根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的各图像的样本类型,其中,样本类型包括第一样本和第二样本,所述第一样本为第一分类结果和第二分类结果相同的图像,所述第二样本为第一分类结果和第二分类结果不相同的图像;
按照预设的第一样本类型比例,从所述第一样本和所述第二样本中选择图像,以将选择出来的图像作为第一训练样本;
使用第一训练样本对所述待训练分类器进行模型训练。
可选地,在对所述待训练分类器训练完成得到第一分类器后,所述方法还包括:
使用所述第一分类器对获取到的第一待分类图像进行分类处理,以得到所述第一待分类图像的第二分类结果;
根据所述第二分类结果,判断所述第一分类器是否满足预设条件,其中,所述预设条件包括:对于每类类别,该类别的分类准确率大于或者等于第一预设阈值,和/或所述第一分类器的整体分类准确率大于或者等于第二预设阈值;
如果所述第一分类器不满足所述预设条件,使用预设图像数据集上的预训练参数对所述第一分类器的参数进行初始化,得到所述待训练分类器;
使用所述待训练分类器对第二候选样本集进行分类,得到所述第二候选样本集中包括的各图像的第三分类结果;
根据所述第三分类结果和获取到的人工对所述第二候选样本集中包括的各图像的第四分类结果,确定所述第二候选样本集中包括的各图像的样本类型,其中,样本类型包括第三样本和第四样本,所述第三样本为第三分类结果和第四分类结果相同的图像,所述第四样本第三分类结果和第四分类结果不相同的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011324849.6/2.html,转载请声明来源钻瓜专利网。