[发明专利]基于深度学习的行人重识别方法在审
申请号: | 202310355991.4 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116416575A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 尚兰芳 | 申请(专利权)人: | 华迪计算机集团有限公司 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/34;G06V10/44;G06V10/46;G06V10/54;G06V10/774;G06V10/80;G06V10/764;G06V10/82;G06N3/08 |
代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 张立君 |
地址: | 100048 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 行人 识别 方法 | ||
1.一种基于深度学习的行人重识别方法,其特征在于,包括:
针对行人重识别的输入数据进行批量归一化,获得训练样本;
建立深度特征提取网络架构进行特征提取;
通过训练样本对所述深度特征提取网络架构进行训练;
根据训练好的深度特征提取网络架构进行行人重识别。
2.根据权利要求1所述的基于深度学习的行人重识别方法,其中,针对行人重识别的输入数据进行批量归一化包括:
输入个数为n的数据,通过仿射变换得到一组新的数据ξ={x(1),x(2),…,x(n)};
计算ξ={x(1),x(2),…,x(n)}的均值μξ,即:
计算ξ={x(1),x(2),…,x(n)}的方差σ2ξ,即:
进行归一化处理,得到即:
通过对归一化后的数据进行尺度变化和偏移,得到批量归一化数据:
3.根据权利要求1所述的基于深度学习的行人重识别方法,其中,所述深度特征提取网络架构包括第一分支与第二分支;输入图像经过两个分支进行特征处理后,将两个分支的特征输入到多尺度池化模块中进行池化操作,然后将输出的特征输入到分类器中进行分类。
4.根据权利要求3所述的基于深度学习的行人重识别方法,其中,输入图像经过所述第一分支进行特征处理包括:
原始输入特征通过扩展形态学轮廓算法提取形态学特征;
通过局部二值模式算法提取纹理特征;
将纹理特征和形态学特征进行特征融合,融合方式为对应位置的像素值相加后取平均,得到融合后特征;
将融合后特征X送入错序注意力模块,得到H',然后将H'再次输入到错序注意力模块,得到全局特征图H″。
5.根据权利要求4所述的基于深度学习的行人重识别方法,其中,原始输入特征通过扩展形态学轮廓算法提取形态学特征包括:
设f(x,y)和g(x,y)为定义在二维离散空间F和G上的两个离散函数,其中f(x,y)为输入图像的每一通道图像在点(x,y)处的灰度函数,g(x,y)为结构元素在点(x,y)处的灰度函数,Df为f(x,y)的域,Dg为g(x,y)的域,则f(x,y)对g(x,y)的扩展腐蚀和扩展膨胀被分别定义为:
其中,dist算子为距离算子,
定义扩展开、闭运算分别为:
经过多次开闭运算,得到多幅形态学特征图像,将多幅形态学特征图像组合叠加,组成形态学特征。
6.根据权利要求4所述的基于深度学习的行人重识别方法,其中,通过局部二值模式算法提取纹理特征包括:
原始的局部二值模式算子定义为在NL*ML尺寸的窗口内,以窗口中心像素为阈值,将相邻的NL·ML个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,NL*ML邻域内的NL·ML个点经比较可产生NL·ML位二进制数,即得到该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息用公式表示如下:
其中,(xc,yc)为中间像素点的值,P为邻域的第P个像素,ip为邻域像素的灰度值,ic为中心像素的灰度值,s(x)为符号函数,定义如下:
对输入图像的每个通道提取纹理特征并重新组合得到纹理特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华迪计算机集团有限公司,未经华迪计算机集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310355991.4/1.html,转载请声明来源钻瓜专利网。