[发明专利]检测模型的训练集更新方法和装置有效
申请号: | 201910270005.9 | 申请日: | 2019-04-04 |
公开(公告)号: | CN110110123B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 许洋;刘鹏;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/51;G06F16/23;G06F40/30;G06V30/413;G06V30/146;G06V30/19 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 模型 训练 更新 方法 装置 | ||
本发明涉及数据更新的技术领域,本发明提供一种检测模型的训练集更新方法和装置,所述方法包括获取样本图片,并根据字段检测算法从所述样本图片中识别字段区域并标注第一检测框;依据设定比例将所述第一检测框向四周进行扩张得到第二检测框,并根据所述第二检测框对所述样本图片进行裁剪,得到目标字段图片;利用众包平台识别所述目标字段图片的所述第二检测框是否错位,并进行错位标注;接收所述众包平台返回的已识别目标字段图片,若所述众包平台的标注用户根据所述错位标注,对错位的所述目标字段图片进行修正,确定所述字段检测算法存在错误;将修正过的所述目标字段图片更新到检测模型的训练集。本发明能提高检测模型的检测能力。
技术领域
本发明涉及数据更新的技术领域,具体而言,本发明涉及一种检测模型的训练集更新方法和装置。
背景技术
在字段检测的领域中,为了对提高字段检测的精准度和效率,通常对字段检测模型进行优化。目前,尤其是对包含多个字段的检测,相应的字段检测模型的优化方案将字段检测的认为平摊至两个字段检测模型上执行,虽然检测效果比只在一个字段检测模型执行的效果要好,但其所占用的服务器资源会增加。
发明内容
为克服以上技术问题,特别是现有技术的检测模型检测速度慢或占用服务器大量资源的问题,特提出以下技术方案:
第一方面,本发明提供一种检测模型的训练集更新方法,包括以下步骤:
获取样本图片,并根据字段检测算法从所述样本图片中识别字段区域并标注第一检测框;
依据设定比例将所述第一检测框向四周进行扩张得到第二检测框,并根据所述第二检测框对所述样本图片进行裁剪,得到目标字段图片;
利用众包平台识别所述目标字段图片的所述第二检测框是否错位,并进行错位标注;
接收所述众包平台返回的已识别目标字段图片,若所述众包平台的标注用户根据所述错位标注,对错位的所述目标字段图片进行修正,确定所述字段检测算法存在错误;
将修正过的所述目标字段图片更新到检测模型的训练集。
在其中一个实施例中,在所述利用众包平台识别所述目标字段图片的检测框是否错位,并进行错位标注的步骤之前,还包括:
将所述目标字段图片发送至众包平台,并得到所述众包平台的标注用户对所述目标字段图片的字段内容的语义进行判断;
根据判断的结果,得到所述字段内容的类别,并进行类别标注。
在其中一个实施例中,在所述得到目标字段图片的步骤之后,还包括:
根据所述字段检测算法对所述目标字段图片进行类别识别;
在所述根据判断的结果,得到所述字段内容的类别,并进行类别标注的步骤之后,还包括:
将所述类别识别的结果与所述类别标注的结果进行对比;
若对比的结果不同,则标注为类别识别错误,对对应的目标字段图片进行丢弃。
在其中一个实施例中,所述利用众包平台识别所述目标字段图片的检测框是否错位,并进行错位标注的步骤包括:
所述对比的结果相同,则根据将所述目标字段图片分配至所述众包平台的标注用户进行识别;
根据识别的结果,判断对所述目标字段图片的第二检测框是否错位;
若所述检测框错位,进行错位标注。
在其中一个实施例中,所述检测模型的训练集更新方法还包括:
若所述标注用户没有对所述目标字段图片进行修正,将对应的目标字段图片进行丢弃。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910270005.9/2.html,转载请声明来源钻瓜专利网。