[发明专利]一种基于多层特征对齐的跨域目标检测方法有效
申请号: | 201910594012.4 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110363122B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 王蒙;李威 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/774;G06V10/82;G06V10/25;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 特征 对齐 目标 检测 方法 | ||
1.一种基于多层特征对齐的跨域目标检测方法,其特征在于,包括以下步骤:
Step1:对源域数据和目标域数据进行预处理;
Step2:将预处理后的源域数据输入SSD检测模型,通过对有标注信息的源域数据进行端到端的训练,得到一个全监督的初始检测模型,并作为下一步训练的预训练模型;
Step3:利用预训练模型对预处理后的源域数据和目标域数据进行特征提取;
Step4:使用对抗生成网络实现源域与目标域多层特征对齐;
所述Step4具体为:通过Step3特征提取后,得到源域特征Fm(xS)和目标域特征Fm(xT),其中m表示第m层卷积特征,然后使用对抗生成网络实现源域与目标域特征的对齐,其中设定对抗生成网络的判别器为Dm,其为一个二分类网络,并以Fm作为生成器,对于判别器,设定源域分类标注为1,目标域分类标注为0,则第m层判别器训练目标函数为二分类交叉熵损失函数:
其中,xS采样于源域数据分布p(xS),xT采样于目标域数据分布p(xT),E(·)表示计算期望值,Dm(Fm(xS))表示源域数据xS的第m层特征属于真实数据的概率,Dm(Fm(xT))表示目标域数据的第m层特征属于生成数据的概率;
在生成网络中,将源域数据集作为真实数据,将目标域数据作为生成数据,则第m层生成网络目标函数为:
联合上述两式,当判别器的输入特征来自于源域时,Dm(Fm(xS))的值趋近于1,当判别器的输入特征来自于目标域时,Dm(Fm(xT))趋近于0,而对于生成器,也即特征提取网络Fm,其目的是使得Dm(Fm(xS))趋近于1,因此,其训练过程中第m特征层的损失函数V(Dm,Fm)为一个极大极小的博弈问题:
也即最小化如下式子:
Step5:将对抗生成网络即对齐网络模型与预训练模型联合训练,得到在源域数据集上训练好的最终检测模型;
将对齐网络模型与预训练模型联合训练,得到最终的检测模型,训练过程中损失函数为:
式中,LD为不同特征层判别器损失函数的和,LF为在源域数据上的检测损失Ldet与不同特征层生成器损失函数的和,为不同特征层的对抗损失的权重。
2.根据权利要求1所述的基于多层特征对齐的跨域目标检测方法,其特征在于,所述Step1中预处理是指对数据进行增广,具体为通过亮度、饱和度以及色调调整,随机裁剪固定区,随机裁剪随机大小,随机翻转固定角度和随机翻转随机角度,得到増广图片,再做归一化处理,并将图片裁剪到固定大小,使其尺寸为300×300。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910594012.4/1.html,转载请声明来源钻瓜专利网。