[发明专利]检测模型的训练集更新方法和装置有效
申请号: | 201910270005.9 | 申请日: | 2019-04-04 |
公开(公告)号: | CN110110123B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 许洋;刘鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/51;G06F16/23;G06F40/30;G06V30/413;G06V30/146;G06V30/19 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 模型 训练 更新 方法 装置 | ||
1.一种检测模型的训练集更新方法,其特征在于,包括以下步骤:
获取样本图片,并根据字段检测算法从所述样本图片中识别字段区域并标注第一检测框;
依据设定比例将所述第一检测框向四周进行扩张得到第二检测框,并根据所述第二检测框对所述样本图片进行裁剪,得到目标字段图片;
根据所述字段检测算法对所述目标字段图片进行类别识别;
将所述目标字段图片发送至众包平台,并得到所述众包平台的标注用户对所述目标字段图片的字段内容的语义进行判断;
根据判断的结果,得到所述字段内容的类别,并进行类别标注;
将所述类别识别的结果与所述类别标注的结果进行对比;
若对比的结果不同,则标注为类别识别错误,对对应的目标字段图片进行丢弃;
利用众包平台识别所述目标字段图片的所述第二检测框是否错位,并进行错位标注,包括:若所述对比的结果相同,则将所述目标字段图片分配至所述众包平台的标注用户进行识别;根据识别的结果,判断对所述目标字段图片的第二检测框是否错位;若所述检测框错位,进行错位标注;
接收所述众包平台返回的已识别目标字段图片,若所述众包平台的标注用户根据所述错位标注,对错位的所述目标字段图片进行修正,确定所述字段检测算法存在错误;
将修正过的所述目标字段图片更新到检测模型的训练集;若所述标注用户没有对所述目标字段图片进行修正,将对应的目标字段图片进行丢弃。
2.根据权利要求1所述的方法,其特征在于,所述获取样本图片,并根据字段检测算法从所述样本图片中识别字段区域并标注第一检测框的步骤包括:
获取样本图片,以检测模型的训练集的字段数据为依据,根据字段检测算法将所述样本图片分成不同字段构成的各个字段区域;
根据各个字段区域的边界,各自标注对应的第一检测框。
3.根据权利要求1所述的方法,其特征在于,所述将修正过的所述目标字段图片更新到检测模型的训练集的步骤包括:
将修正过的所述目标字段图片的保存;
定期获取经过修正的目标字段图片,对所述训练集进行更新。
4.一种检测模型的训练集更新装置,其特征在于,包括:
区域标注模块,用于获取样本图片,并根据字段检测算法从所述样本图片中识别字段区域并标注第一检测框;
裁剪模块,用于依据设定比例将所述第一检测框向四周进行扩张得到第二检测框,并根据所述第二检测框对所述样本图片进行裁剪,得到目标字段图片;
错位标注模块,用于利用众包平台识别所述目标字段图片的所述第二检测框是否错位,并进行错位标注;
修正模块,用于接收所述众包平台返回的已识别目标字段图片,若所述众包平台的标注用户根据所述错位标注,对错位的所述目标字段图片进行修正,确定所述字段检测算法存在错误;
更新模块,用于将修正过的所述目标字段图片更新到检测模型的训练集;
其中,检测模型的训练集更新装置还用于将所述目标字段图片发送至众包平台,并得到所述众包平台的标注用户对所述目标字段图片的字段内容的语义进行判断;根据判断的结果,得到所述字段内容的类别,并进行类别标注;根据所述字段检测算法对所述目标字段图片进行类别识别;将所述类别识别的结果与所述类别标注的结果进行对比;若对比的结果不同,则标注为类别识别错误,对对应的目标字段图片进行丢弃;若所述标注用户没有对所述目标字段图片进行修正,将对应的目标字段图片进行丢弃;
错位标注模块具体用于若所述对比的结果相同,则将所述目标字段图片分配至所述众包平台的标注用户进行识别;根据识别的结果,判断对所述目标字段图片的第二检测框是否错位;若所述检测框错位,进行错位标注。
5.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于执行根据权利要求1至3任一项所述的检测模型的训练集更新方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-3任一项所述的检测模型的训练集更新方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910270005.9/1.html,转载请声明来源钻瓜专利网。