[发明专利]基于背景抑制的行人属性识别方法有效
申请号: | 201910482659.8 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110222636B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张良;袁配配 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/40 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 背景 抑制 行人 属性 识别 方法 | ||
一种基于背景抑制的行人属性识别方法,其包括提取行人掩码图与背景掩码图;构建行人属性识别网络;行人特征向量提取;背景特征向量提取;网络优化;属性识别等步骤。本发明方法通过引入行人掩码图和背景掩码图,将其与行人属性识别网络分类层的输出特征图结合,使行人属性识别网络能获取分类层的行人特征图和背景特征图,然后提取行人图像特征向量、行人特征向量、背景特征向量,联合加权交叉熵损失函数和区域级三元损失函数两个损失函数共同训练,使行人属性识别网络在完成属性识别的同时,提高网络提取特征的稳定性。在此损失函数的约束下,神经网络学习到的特征将具有背景杂乱不变性,从而可提高行人属性识别的准确度。
技术领域
本发明属于图像处理技术领域,特别是涉及一种基于背景抑制的行人属性识别方法。
背景技术
行人属性识别是计算机视觉领域一项重要的任务,其在智能视频监控系统中起着至关重要的作用。行人属性识别可以将监控视频中的大量行人信息转换为可用于检索的高级语义信息(如性别、年龄、服饰、携带品等),这些信息可以应用于嫌疑人搜索、失踪人口查找等工作中。通常,这些信息需要依靠人工观察的方式进行提取,工作量巨大且十分耗时。行人属性识别可以自动对监控视频中的信息进行提取,因而,具有较为广阔的应用前景。
但监控视频环境复杂,传统方法难以对监控场景的行人图像进行有效的特征描述。随着深度学习在计算机视觉任务中的表现越来越突出,研究人员提出多种基于深度学习的行人属性识别算法。对GoogleNet进行改进(陈萍,杨鸿波.基于深度学习的行人属性识别[J].信息通信,2018(04):74-76.),使模型可以输入任意大小的图像,无需对图像进行缩放或裁剪。利用poselet部件检测器对行人进行分割(LI Y N,HUANG C,Loy C C,etal.Human Attribute Recognition by Deep Hierarchical Contexts[C]//Procee-dingsof the European Conference on Computer Vision.Berlin,Germany:Springer,2016:684-700.),将分割后的行人部件与行人整体结合,提取深度特征进行行人属性识别。
现有的方法虽然都取得不错的识别效果,但由于监控场景的背景杂乱以及行人被遮挡等问题,行人属性识别在实际应用时的效果并不理想。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于背景抑制的行人属性识别方法。
为了达到上述目的,本发明提供的基于背景抑制的行人属性识别方法包括按顺序进行的下列步骤:
(1)利用图像语义分割方法中经典的Deeplab-v2网络提取行人属性数据集中行人图像的行人掩码图与背景掩码图;
(2)构建如图1所示的行人属性识别网络,所述的行人属性识别网络以Resnet-50网络作为基础网络,在Resnet-50网络上增加了两个分支而对该网络进行改进,并以加权交叉熵损失函数和区域级三元损失函数联合作为行人属性识别网络中分类层的损失函数;
(3)以行人图像作为步骤(2)中行人属性识别网络的输入,将Resnet-50网络中残差块1的输出特征图与步骤(1)中的行人掩码图逐元素相乘即可获得行人特征图,然后利用残差块2、残差块3和残差块4继续对上述行人特征图进行提取,即可获得行人特征向量;
(4)以行人图像作为步骤(2)中行人属性识别网络的输入,将上述Resnet-50网络中残差块1的输出特征图与步骤(1)中的背景掩码图逐元素相乘即可获得背景特征图,然后利用残差块2、残差块3和残差块4继续对背景特征图进行提取,即可获得背景特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910482659.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防替跑系统
- 下一篇:一种基于3D图像人头识别的客流统计方法及其系统