[发明专利]基于感知逻辑和特征对比的图像显著性检测方法有效
申请号: | 202011013434.7 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112132810B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 钟桦;袁彦博;程枭;李海雄;贾帅帅 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464;G06N3/048;G06N3/082;G06V10/82;G06V10/80 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 感知 逻辑 特征 对比 图像 显著 检测 方法 | ||
1.一种基于感知逻辑和特征对比的图像显著性检测方法,其特征在于,使用基于特征对比的高阶特征提取模块获得待检测目标的显著性特征,使用训练好的基于感知逻辑的深度神经网络检测显著性目标;该方法的步骤包含如下:
步骤1,构建子卷积神经网络:
第一步,搭建一个由5个相同结构的子模块并联组成的特征预处理模块,每个子模块的结构依次为:第一卷积层→第二卷积层→Batch Normalization层→PReLu层;
每个子模块中所有层的卷积核大小均为3*3,步长均设置为1;第一个子模块中第一、第二卷积层的卷积核个数均为64;第二个子模块中第一、第二卷积层的卷积核个数均为256;第三个子模块中第一、第二卷积层的卷积核个数均为512;第四个子模块中第一、第二卷积层的卷积核个数均为1024;第五个子模块中第一、第二卷积层的卷积核个数均为2048;
第二步,搭建一个由5个相同结构的子模块并联组成的高阶特征提取模块,每个子模块的结构依次为:第一卷积层→第二卷积层→第一特征融合层→显著性计算层→第二特征融合层;其中第一卷积层和第二卷积层并联;
所述第一特征融合层采用公式实现;其中,E表示高阶特征提取模块中的第一特征融合层输出的一组特征图,Cx表示高阶特征提取模块中第一卷积层输出的特征图,Cy表示高阶特征提取模块中第二卷积层输出的特征图;
所述显著性计算层采用公式实现;其中,S表示高阶特征提取模块中的显著性计算层输出的显著性特征图,C表示由特征预处理模块提取并向高阶特征提取模块输入的一组特征图;
每个子模块中第一卷积层的卷积核大小均为1*3;每个子模块中第二卷积层的卷积核大小均为3*1;每个子模块中所有层的卷积核步长均为设置为1;第一个子模块中第一、第二卷积层的卷积核个数均为320;第二个子模块中第一、第二卷积层的卷积核个数均为832;第三个子模块中第一、第二卷积层的卷积核个数均为1792;第四个子模块中第一、第二卷积层的卷积核个数均为3584;第五个子模块中第一、第二卷积层的卷积核个数均为3072;
第三步,搭建一个由5个相同结构的子模块并联组成的高阶特征后处理模块,每个子模块的结构依次为:第一卷积层→上采样层;
每个子模块的卷积层大小均为3*3,步长均设置为1;第一个子模块中第一卷积层的卷积核个数均为320;第二个子模块中第一卷积层的卷积核个数均为832;第三个子模块中第一卷积层的卷积核个数均为1792;第四个子模块中第一卷积层的卷积核个数均为3584;第五个子模块中第一卷积层的卷积核个数均为3072;上采样层中的采样方法设置为双线性插值法;
第四步,搭建1个由concat层和第一卷积层的两层的网络决策模块;其中,卷积核的大小为1*1,步长为1,卷积核的个数为5;
第五步,将特征预处理模块、高阶特征提取模块、高阶特征后处理模块与网络决策模块依次连接组成子卷积神经网络;其中,
所述特征预处理模块与高阶特征提取模块交叉连接,每个特征预处理模块的子模块与两个或三个高阶特征提取模块的子模块连接;具体地,特征预处理模块的第1个子模块分别与高阶特征提取模块的第1个和第2个子模块连接,特征预处理模块的第2个子模块分别与高阶特征提取模块的第1个、第2个和第3个子模块连接,特征预处理模块的第3个子模块分别与高阶特征提取模块的第2个、第3个和第4个子模块连接,特征预处理模块的第4个子模块分别与高阶特征提取模块的第3个、第4个和第5个子模块连接,特征预处理模块的第5个子模块与高阶特征提取模块的第4个和第5个子模块连接;
高阶特征提取模块与高阶特征后处理模块串联,具体操作为,高阶特征提取模块的第i个子模块与高阶特征后处理模块的子模块中第j个子模块串联相接;i=1,2,…,5,j的取值与i对应相等;
高阶特征后处理模块的子模块并联接入网络决策模块的concat层;
步骤2,生成训练集:
第一步,选取至少10000张图片,每张中均包含简单背景与复杂背景且含有显著性目标,图片的格式为jpg格式;
第二步,对每张图片中的像素点进行标注,将含有目标的像素值设置为255;不含有目标的像素值设置为0,标注后的图像保存为png格式文件;将带有标注的图片组成训练集;
步骤3,训练子卷积神经网络:
将训练集输入到子卷积神经网络中,迭代更新子卷积神经网络的权值,直至网络损失函数值下降到1.0以下且不再有较大波动为止,得到训练好的子卷积神经网络,网络参数中学习率设置为0.001;
步骤4,生成卷积神经网络:
将训练好的ResneXt-101网络模型作为特征提取模块,与训练好的子卷积神经网络组成卷积神经网络;
步骤5,对待检测目标进行检测:
将含有显著性目标的待检测的每张图片输入到训练好的卷积神经网络中;输出该图片中显著性目标的分割图。
2.根据权利要求1所述的基于感知逻辑和特征对比的图像显著性检测方法,其特征在于,步骤3中所述损失函数公式如下:
其中,W表示输入到子卷积神经网络中的每张图片与之对应的标注值的损失值的平均值,n表示训练集中图片的总数,i表示输入到子卷积神经网络中图片的序号,yi表示与输入到子卷积神经网络中的第i张图片对应的标注值,log表示以10为底的对数操作,xi表示输入到子卷积神经网络中的第i张图片的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013434.7/1.html,转载请声明来源钻瓜专利网。