[发明专利]基于协同学习的弱监督检测模型训练方法及系统在审
申请号: | 201810328284.5 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108734195A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 张娅;王嘉杰;姚江超;王延峰 | 申请(专利权)人: | 王延峰;张娅 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200063 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 强检测器 检测 检测器 检测器误差 模型训练 视觉特征 训练条件 协同 标注 卷积神经网络 计算训练 检测结果 训练过程 训练收敛 包围框 交叉熵 再利用 监督 学习 图片 抽象 预测 更新 | ||
1.一种基于协同学习的弱监督检测模型训练方法,其特征在于包括:
S1:使用卷积神经网络提取图片的抽象视觉特征;
S2:使用强检测器和弱检测器根据抽象视觉特征对图片检测结果进行预测,其中:
所述强检测器DS,需要图片中的包围框标注作为训练条件,包括每一个包围框的类别标注和坐标标注
所述弱检测器DW,仅需图片类别标签yc作为训练条件,不需要精细的包围框标注
S3:根据上述预测结果计算训练误差,所述训练误差由强检测器误差和弱检测器误差两部分组成,包含作用于弱检测器的交叉熵误差L(DW)和作用于强检测器的一致性误差L(DS);
S4:基于得到的训练误差,使用梯度回传算法同时更新强检测器和弱检测器的参数,直至训练收敛。
2.根据权利要求1所述的基于协同学习的弱监督检测模型训练方法,其特征在于:所述作用于强检测器的一致性误差L(DS),为强检测器在没有包围框标注的情况下训练提供训练目标,其过程为:
获得强检测器和弱检测器在同一张图片中的包围框预测{(pi,ti)}和{(pj,tj)},其中,pi,pj分别是强检测器和弱检测器的类别预测,ti,tj分别是强检测器和弱检测器的坐标预测;
计算强检测器内部对于每一个包围框的类别预测一致程度
计算强检测器和弱检测器之间对于包围框的类别预测一致程度和坐标预测一致程度
对和进行加权求和并取负,即得到作用于强检测器的一致性误差L(DS)。
3.根据权利要求2所述的基于协同学习的弱监督检测模型训练方法,其特征在于:所述强检测器在没有包围框标注的情况下,通过预测目标保持一致性进行训练,一致性既包含了与自身的预测相一致,又包含了两个检测器之间预测相一致,保证训练方法的鲁棒性。
4.根据权利要求3所述的基于协同学习的弱监督检测模型训练方法,其特征在于:所述计算两个检测器之间预测的一致性,既包含了对包围框坐标的一致性计算,即又包含了对包围框类别的一致性计算,即其中,pi,pj分别是强检测器和弱检测器的类别预测,ti,tj分别是强检测器和弱检测器的坐标预测。
5.根据权利要求4所述的基于协同学习的弱监督检测模型训练方法,其特征在于:两个检测器之间的类别预测一致程度用似然函数pjclogpic进行衡量,坐标预测一致程度用L1-smooth函数R(tjc-tic)衡量;强检测器内部的类别预测一致程度用似然函数piclogpic衡量;pic,pjc分别是强检测器和弱检测器对于第i个和第j个包围框的关于第c个类别的类别预测结果,tic,tjc分别是强检测器和弱检测器对于第i个和第j个包围框的关于第c个类别的坐标预测结果;
因此,L(DS)用公式表述为:
其中,Iij代表一个适性函数,当来自强检测器的包围框与弱检测器的包围框重叠率大于50%,Iij=1,否则为Iij=0;参数β用于控制和之间的权重,解决仅仅依赖两检测器之间一致性时带来的不稳定性,其中β∈(0,1);BW,BS为由包围框搜索算法生成的用于弱检测器和强检测器的包围框数量,C代表类别总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王延峰;张娅,未经王延峰;张娅许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810328284.5/1.html,转载请声明来源钻瓜专利网。