[发明专利]一种基于目标检测学习算法的图片数据筛选方法及系统在审
申请号: | 202210568801.2 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114898182A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 闫军;纪双西 | 申请(专利权)人: | 智慧互通科技股份有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/25;G06V10/42;G06V10/762;G06F16/538 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 075000 河北省张*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 检测 学习 算法 图片 数据 筛选 方法 系统 | ||
1.一种基于目标检测学习算法的图片数据筛选方法,其特征在于,所述方法包括:
将初始待标注图片数据集划分为训练集、验证集、测试集;
通过所述训练集和所述验证集对初始目标检测模型进行训练,获取目标检测模型;
根据所述测试集、所述目标检测模型的综合评分指标、所述目标检测模型的预测结果,确定所述初始待标注图片数据集对应的综合图片不确定性指标,并根据所述综合图片不确定性指标对所述初始待标注图片数据集进行筛选;
通过所述目标检测模型和预置图片特征聚类算法对筛选后的待标注图片数据进行二次筛选;
将所述进行二次筛选后的待标注图片数据集通过所述目标检测模型进行预测,获取预标注标签;
根据所述预标注标签对待标注图片数据集进行修正,并通过修正后的待标注图片数据集更新所述训练集后,训练所述目标检测模型。
2.根据权利要求1所述的一种基于目标检测学习算法的图片数据筛选方法,其特征在于,所述根据所述测试集、所述目标检测模型的综合评分指标、所述目标检测模型的预测结果,确定所述初始待标注图片数据集对应的综合图片不确定性指标的步骤包括:
通过所述综合评分指标的上下限阈值获取两组预测结果,并根据两组预测结果获取图片级目标框定位不稳定性指标;
通过所述综合评分指标和目标检测模型在预期最终输出条件下的评分阈值获取的预测结果,获取图片级分类预测不稳定性指标;
根据所述测试集的标注信息,获取所述预测结果相对于标注信息的图片级平均准确率;
通过所述图片级目标框定位不稳定性指标、图片级分类预测不稳定性指标以及图片级平均准确率,确定综合图片不确定性指标。
3.根据权利要求2所述的一种基于目标检测学习算法的图片数据筛选方法,其特征在于,所述通过所述图片级目标框定位不稳定性指标、图片级分类预测不稳定性指标以及图片级平均准确率,确定综合图片不确定性指标,并根据所述综合图片不确定性指标对所述初始待标注图片数据集进行筛选的步骤包括:
根据所有测试集图片分别对应的图片级目标框定位不稳定性指标、图片级分类预测不稳定性指标以及图片级平均准确率,获取各个图片分别对应的综合图片不确定性指标;
获取综合图片不确定性指标大于预设阈值的图片作为筛选后的初始待标注图片数据集。
4.根据权利要求1或2所述的一种基于目标检测学习算法的图片数据筛选方法,其特征在于,所述通过所述目标检测模型和预置图片特征聚类算法对筛选后的待标注数据进行二次筛选的步骤包括:
将所述待标注图片数据输入到所述目标检测模型,提取模型FPN层输出的多尺度特征图,并将所述多尺度特征图进行池化拼接后得到每个待标注图片对应的特征向量;
将所述所有图片的特征向量组合的特征向量矩阵进行压缩得到预期维度的特征表示,并通过对所有图片的特征表示集合进行聚类计算,获取各个图片的聚类簇类别;
根据各个图片的聚类簇类别对所述待标注图片数据集进行二次筛选。
5.根据权利要求4所述的一种基于目标检测学习算法的图片数据筛选方法,其特征在于,所述根据各个图片的聚类簇类别对所述待标注图片数据集进行二次筛选的步骤包括:
根据各个图片的聚类簇类别标签,计算经过第一次筛选后的数据集中各个聚类簇内数据量占总数据量的比值以及各个簇内二次筛选数据量;
根据各个聚类簇内数据分别对应的综合图片不确定性指标,从大到小选取预置个数的数据进行整合作为最终的二次筛选数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧互通科技股份有限公司,未经智慧互通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210568801.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:药筒自动刷色环机构
- 下一篇:一种育肥猪槟榔芋发酵饲料及其制备方法