[发明专利]基于部分共享网络和余弦间隔损失函数的行人搜索方法有效
申请号: | 201911337014.1 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111209799B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 罗炬锋;陈浩然;李丹;曹永长;偰超;张力;崔笛扬;郑春雷 | 申请(专利权)人: | 上海物联网有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/25;G06N3/04;G06N3/08 |
代理公司: | 上海泰能知识产权代理事务所(普通合伙) 31233 | 代理人: | 宋缨;钱文斌 |
地址: | 201800 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 部分 共享 网络 余弦 间隔 损失 函数 行人 搜索 方法 | ||
1.一种基于部分共享网络和余弦间隔损失函数的行人搜索方法,其特征在于,包括以下步骤:
(1)构建神经网络结构,包括行人建议网络和行人重识别网络;所述神经网络结构采用ResNet-50作为基础网络,所述ResNet-50包括卷积层Conv1和四个卷积层组Conv2_x到Conv5_x,其中,每个卷积层组分别有3,4,6和3个残差单元;其中,所述神经网络结构采用多损失函数进行训练,总的损失函数的形式表示为:行人建议网络损失函数+r*行人重识别网络损失函数,其中,r为调节参数,通过对r的调节缓解行人检测和重识别之间的相互干扰;所述行人重识别网络损失函数采用余弦间隔损失函数,表示为:其中,N表示一个训练批次中的有标签样本总数,s为尺度参数,θj,i表示第i个样本xi和有标签类别的行人特征向量vj的夹角,m为表示引入的余弦间隔,L表示有标签样本的类别总数,Q≈L,ψk,i表示第i个样本xi和无标签类别的行人特征向量uk的夹角;对有标签类别的行人特征向量vj的更新方式为:其中,Nt表示一个训练批次中类别为t的样本总数,Ci表示第i个样本xi作为行人的置信度,μ是一个随着训练周期增大而增大的变量;
(2)将图片输入至所述神经网络结构,所述神经网络结构的Conv1到Conv3_4作为主干网络提取浅层特征图,所述浅层特征图由行人建议网络和行人重识别网络共享;
(3)当所述浅层特征图被提取出来后,会进入两条支路;第一条支路将所述浅层特征图送往复制的卷积网络层组Conv4_1到Conv4_3进行进一步的特征提取,然后被送往行人建议网络中产生多个行人建议框;第二条支路将所述浅层特征图送往兴趣池化层,并将所述行人建议网络得到的行人建议框作为感兴趣的区域,在浅层特征图中池化出每个框对应的行人特征图;
(4)将所述行人特征图输入至由卷积层组Conv4_1到Conv5_3构成的行人重识别网络,输出深层行人特征图,通过全局平均池化层进行池化,最终将每个行人特征图映射为一个a维的行人特征向量。
2.根据权利要求1所述的基于部分共享网络和余弦间隔损失函数的行人搜索方法,其特征在于,所述步骤(1)中的行人建议网络采用Faster R-CNN的结构。
3.根据权利要求1所述的基于部分共享网络和余弦间隔损失函数的行人搜索方法,其特征在于,所述步骤(4)后还包括:使用一个全连接层将a维的行人向量映射到b维的特征子空间中,然后再对b维特征子空间的行人特征进行L2-正则化以防止过拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海物联网有限公司,未经上海物联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911337014.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:病案首页编码方法及系统
- 下一篇:基于DNS流量的主机挖矿行为检测方法