[发明专利]图像训练样本筛选和任务模型训练方法、装置及电子设备在审

专利信息
申请号: 202110234576.4 申请日: 2021-03-03
公开(公告)号: CN112906805A 公开(公告)日: 2021-06-04
发明(设计)人: 陈鹏;张迪;石仕伟;吴昌建;张玉全;曹海潮 申请(专利权)人: 杭州海康威视数字技术股份有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/46;G06N3/04;G06N3/08
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 丁芸;马敬
地址: 310051 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 训练 样本 筛选 任务 模型 方法 装置 电子设备
【说明书】:

本申请实施例提供了一种图像训练样本筛选和任务模型训练方法、装置及电子设备,通过提取图像集中各图像的图像特征,确定出各图像的类别,然后在每一类图像中选择预设数量的图像作为推荐图像,在对待筛选图像集进行筛选的同时,保证了筛选出的推荐图像的多样性,在对各推荐图像进行人工标定后,根据各推荐图像的标定信息,计算各推荐图像的不确定性,最终筛选出各推荐图像中不确定性大于预设阈值的图像作为图像训练样本,经过两次筛选,筛选出的图像训练样本不仅具有多样性,且不确定性较高,属于更难学习的图像训练样本,基于这些图像训练样本对任务模型进行训练,能够有效提升任务模型的训练精度,进一步提升训练得到的任务模型的性能。

技术领域

本申请涉及机器学习技术领域,特别是涉及一种图像训练样本筛选和任务模型训练方法、装置及电子设备。

背景技术

随着人工智能技术的不断发展,大量采用有监督学习训练方式的深度学习算法得到了非常广泛的应用。采用有监督学习训练方式的深度学习算法指的是,利用大量已标定的图像训练样本对神经网络模型进行训练,得到可以完成指定任务的任务模型,利用该任务模型可对输入的图像执行指定任务,例如,对图像进行目标检测、分类识别等。

任务模型的性能与训练过程有着非常紧密的关联,图像训练样本越多,利用这些图像训练样本训练得到的任务模型的性能就越好,在具体实施时,首先需要标定工作人员对采集的初始图像进行标定,才可得到图像训练样本。然而,海量的初始图像一般是从互联网或者采集设备上随机获取的,有些初始图像无法避免地会伴随着较多的噪声及大量的内容冗余,如果标定工作人员对采集的所有初始图像都进行人工标定,势必会造成大量的人力资源浪费。

并且,即便标定工作人员对所有初始图像都进行了人工标定,但是由于有些图像训练样本携带有噪声和内容冗余,这些噪声和内容冗余必定会影响任务模型的训练精度,导致训练得到的任务模型性能较差。

发明内容

本申请实施例的目的在于提供一种图像训练样本筛选和任务模型训练方法、装置及电子设备,以提升任务模型的训练精度,进一步提升训练得到的任务模型的性能。具体技术方案如下:

第一方面,本申请实施例提供了一种图像训练样本筛选方法,该方法包括:

获取待筛选图像集;

提取待筛选图像集中各图像的图像特征,并根据各图像的图像特征,确定各图像的类别;

根据各图像的类别,从每一类图像中选择预设数量的图像,作为推荐图像反馈至客户端,以使用户在客户端上对推荐图像进行人工标定;

获得人工标定后的各推荐图像,并根据各推荐图像的标定信息,计算各推荐图像的不确定性;

筛选各推荐图像中不确定性大于预设阈值的图像,作为图像训练样本。

可选的,获取待筛选图像集的步骤,包括:

获取客户端上传的初始图像集;

对初始图像集中的各初始图像进行图像分析,得到各初始图像的分析结果;

根据各初始图像的分析结果,确定可丢弃的初始图像,并将可丢弃的初始图像的图像信息以提示消息的方式发送至客户端,以提示用户在客户端上选择是否丢弃可丢弃的初始图像;

获取客户端发送的选择结果;

若选择结果为丢弃可丢弃的初始图像,则确定初始图像集中除可丢弃的初始图像以外剩余的初始图像组成的图像集为待筛选图像集;

若选择结果为保留可丢弃的初始图像,则确定初始图像集为待筛选图像集;

若选择结果为丢弃部分可丢弃的初始图像,则确定初始图像集中除上述部分可丢弃的初始图像以外剩余的初始图像组成的图像集为待筛选图像集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110234576.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top