[发明专利]一种基于语义分割的行人多属性识别方法有效
申请号: | 201810621599.9 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108921054B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 凌贺飞;陆竭;李平 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 分割 行人 属性 识别 方法 | ||
1.一种基于语义分割的行人多属性识别方法,其特征在于,包括以下步骤:
预选行人的多种属性特征,包括颜色属性、类型属性以及性别属性;
基于特征融合层构建一个端到端的全卷积神经网络,所述神经网络的基本结构是AlexNet,其前面为卷积层,中间为分裂成三条分支的卷积层,第一条分支通过特征融合层连接第一反卷积层得到颜色属性的语义分割结果,第二条分支通过特征融合层连接第二反卷积层得到类型属性的语义分割结果,第三条分支通过二分类,得到性别属性,所述特征融合层用于对颜色属性和类型属性互补;
基于所述神经网络随机选取训练样本中的图像进行训练,得到行人多属性识别模型,所述行人多属性识别模型用于识别图像中行人的属性;
基于所述行人多属性识别模型提取行人库中所有行人图像的属性并存储到数据库;
根据待查找行人的属性,从所述数据库中匹配查找符合要求的行人图像;
所述行人多属性识别模型的训练步骤为:
每次随机选择训练样本中的一张图像用来训练;
将所选图像输入神经网络后,前向传播计算神经网络各层的值,网络的三条分支分别得到各自的损失值:
所述第一条分支的损失函数为:
所述第二条分支的损失函数为:
所述第三条分支的损失函数为:
其中,N表示训练图像的像素点个数,y表示训练图像的性别标签,y(i)表示训练图像第i个像素点的颜色或类型标签,x表示输入特征值,x(i)表示第i个像素点输入特征值,λ表示权重衰减参数,θij表示第i个参数向量第j个值,θj表示第j个参数向量,表示第l个参数向量的转置,表示第j个参数向量的转置,K表示颜色属性或类型属性的数量;
反向逐层更新神经网络各层参数,根据各分支损失函数的导数最小化三个分支的损失函数;
重复迭代上述步骤,达到最大迭代次数后,训练得到行人多属性识别模型。
2.根据权利要求1所述的基于语义分割的行人多属性识别方法,其特征在于,训练所述行人多属性识别模型前,预设用于梯度下降加速的动量、权重衰减参数及基础学习率,并且训练过程中一直保持不变,预设训练的最大迭代次数;并以数据集ImageNet预先训练的模型作为神经网络的初始参数;
训练过程中,反向逐层采用梯度下降算法更新神经网络各层参数,根据各分支损失函数的导数最小化三个分支的损失函数,根据如下公式计算各分支损失函数的导数:
所述第一条分支的损失函数导数为:
所述第二条分支的损失函数导数为:
所述第三条分支的损失函数导数为:
其中,p(y(i)=j|x(i);θ)表示将像素点x(i)分类为类别j的概率,p(y=j|x;θ)表示将图像x分类为类别j的概率。
3.根据权利要求1所述的基于语义分割的行人多属性识别方法,其特征在于,基于特征融合层构建一个端到端的全卷积神经网络,包括:
神经网络模型的激活函数采用ReLU激活函数,其函数表达式为:
其中,f(x)表示激活函数的输出,x表示激活函数的输入;
特征融合的公式表达如下:
其中,xi表示颜色特征图上第i个点激活值,yi表示类型特征图上第i个点激活值;α和β表示融合参数,当xi=0且yi0,α和yi的乘积重新激活xi,同样的方法应用于yi,经过该特征图融合,颜色特征和类型特征相互弥补。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810621599.9/1.html,转载请声明来源钻瓜专利网。