[发明专利]一种基于先验原型注意力机制的人体图像多属性分类方法有效
申请号: | 202010977999.0 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112418261B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 段贵多;许毅;朱大勇;罗光春;候卫东;鲁辰喜 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06V40/10;G06N3/04;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 先验 原型 注意力 机制 人体 图像 属性 分类 方法 | ||
1.基于先验原型注意力机制的人体图像多属性分类方法,其特征在于,包括如下步骤:
步骤S1:构建属性表和对应的人体图像数据集;
若图像中某个属性的位置被遮挡或没有被拍摄到,则将该属性的标签值设置为-1,即作为负样本;
若图像中存在某个属性,则将该属性的标签值设置为1,反之设置为0;
且人体图像数据集中的图像包含一个或多个属性的相关区域;
步骤S2:构建多属性分类的神经网络模型:
选择基于神经网络的多分类网络模型,所述基于神经网络的多分类网络模型包括输入层、隐藏层和分类层;多层的隐藏层用于提取输入图像的特征图;分类层基于最后一层隐藏层输入的特征图,预测输入图像属于指定类别的预测概率;
去掉分类层的多分类网络模型作为多属性分类的神经网络模型的初级特征提取网络,并将初级特征提取网络输出的特征图定义为特征图F,且特征图F的形状为H×W×C,其中H×W表示特征图的大小,即高和宽;C表示特征图的通道数;
设置用于k个任务适用的先验注意力原型图Ai,且先验注意力原型图Ai的大小为H×W,其中i=1,2,...,k,k的取值为预设值;
将特征提取网络输出的作为输入,添加L个分支,每个分支包括依次连接的三个子块;
其中,L表示进行分类的属性总数目;
每个分支的三个子块分别为:
第一子块包括依次连接的第一全局平均池化层、第一全连接层和第二全连接层;且第一子块的输入为特征图F,输出为原型系数Cj,所述原型系数Cj为长度为k的一维向量,其中j=1,2,...,L;
第二子块:将k个先验注意力图Ai与当前支路的原型系数Cj进行加权求和,得到对应属性的注意力图并将注意力图与特征图F进行逐点乘法运算得到当前支路的新特征图
第三个子块包括依次连接的第二全局平均池化层、第三全连接层和第四全连接层;输入为新特征图输出为当前支路对应的属性的预测概率;其中j=1,2,...,L;
步骤S3:训练多属性分类的神经网络模型:
将训练图像做水平翻转并将其加入到训练图像中,按照步骤S1构建属性表;
将基于神经网络的多分类网络模型的已有训练过的网络参数作为初级特征提取网络的网络参数的初始值;
基于预设的损失函数和训练参数,对多属性分类的神经网络模型的网络参数进行迭代训练;
步骤S4:利用训练好的多属性分类的神经网络模型对图像进行属性分类处理:
基于训练好的多属性分类的神经网络模型的前向计算的输出,得到该图像中各个属性的预测概率,并基于各预测概率与预设阈值的匹配结果,确定图像中各个属性分类结果。
2.如权利要求1所述的人体图像多属性分类方法,其特征在于,步骤S2中,设置用于k个任务适用的先验注意力原型图Ai具体为:
将k个先验注意力图Ai设置为中心点不同的高斯热图;
且每个先验注意力原型图Ai的每个像素点(x,y)的像素值A(x,y)为:
其中,(coli,rowi)表示第i个高斯热图的中心点坐标,σ表示高斯热图的方差。
3.如权利要求2所述的人体图像多属性分类方法,其特征在于,k个中心点均匀地分布在W×C的网格上。
4.如权利要求3所述的人体图像多属性分类方法,其特征在于,将方差σ设置为1。
5.如权利要求1所述的人体图像多属性分类方法,其特征在于,步骤S3中还包括:计算所有训练图像的均值并记为Imean,基于Imean对输入初级特征提取网络的输入图像进行归一化处理;且步骤S4还包括:基于Imean对输入初级特征提取网络的输入图像进行归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010977999.0/1.html,转载请声明来源钻瓜专利网。