[发明专利]排列注意力特征的全景图像显著性预测方法、系统及终端有效
申请号: | 202010171615.6 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111488886B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 杨小康;朱丹丹;闵雄阔;朱煜程;朱文瀚;翟广涛 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/80;G06V10/82;G06N3/0464;G06N3/0985 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排列 注意力 特征 全景 图像 显著 预测 方法 系统 终端 | ||
1.一种基于排列注意力特征的全景图像显著性预测方法,其特征在于,包括:
提取模板特征图和逐通道特征图,将所述模板特征图和所述逐通道特征图进行相乘生成逐通道特征;
将生成的所述逐通道特征进行注意力特征排列;
根据排序结果,选择对细粒度显著性预测有用的所述逐通道特征进行特征增强,将选择的所述逐通道特征输入到卷积神经网络中进行头部注视点的预测;
所述提取模板特征图,包括:
使用基于ResNet50预测网络的两阶段分支网络提取前景注意力图和背景注意力图;
将得到的所述前景注意力图和所述背景注意力图进行加权融合得到模板特征图;
所述使用基于ResNet50预测网络的两阶段分支网络提取前景注意力图和背景注意力图,包括:
在第一阶段进行预测的公式如下:
F1=φ1(M1),
其中,F1和B1分别表示预测的前景注意力图和背景注意力图,M1是通过ResNet50预测网络得到的特征图,φ1和表示两个独立的ResNet50预测网络;
在第二阶段,对第一阶段生成的前景注意力图和背景注意力图进行增强,其具体的公式是:
Fatt=φ2(M2|F1,B1),
其中,Fatt和Batt分别表示最终预测的前景注意力图和背景注意力图,M2是在第二阶段通过ResNet50网络预测得到的特征图,φ2和表示在第二阶段两个独立的ResNet50预测网络;
所述提取逐通道特征图,包括:
利用基于ResNet50预测网络提取逐通道特征图,所述逐通道特征图是在ResNet50预测网络的最后一层输出的特征图。
2.根据权利要求1所述的基于排列注意力特征的全景图像显著性预测方法,其特征在于,将得到的所述前景注意力图和所述背景注意力图进行加权融合得到模板特征图,是指:
采用线性加权的方法对得到的所述前景注意力图和所述背景注意力图进行融合得到模板特征图。
3.根据权利要求1所述的基于排列注意力特征的全景图像显著性预测方法,其特征在于,所述将生成的逐通道特征进行注意力特征排列,包括:
对逐通道的特征图按照其对应的分数进行从大到小的排序,逐通道特征图的分数越大表明该通道特征对最后的细粒度显著性预测越重要。
4.根据权利要求3所述的基于排列注意力特征的全景图像显著性预测方法,其特征在于,所述将生成的逐通道特征进行注意力特征排列,按照以下方法实现:
通过排列网络自动学习排列分数来展示逐通道特征图的重要性,计算排列分数的公式被定义为:
r'=fn(S')+fmax(S')
其中,fn是基于CNN的网络,fmax是包含有逐通道全局最大池化层的网络,S'表示逐通道特征图,r'表示排列分数;
根据得到的排列分数对逐通道特征图从大到小进行排列,其具体的计算公式如下:
其中,表示排列后有序的逐通道特征图。
5.根据权利要求1-4任一项所述的基于排列注意力特征的全景图像显著性预测方法,其特征在于,所述选择对细粒度显著性预测有用的逐通道特征进行特征增强,包括:
根据逐通道特征图的排列分数大小和实验效果选择对细粒度显著性预测重要的一些特征,舍弃掉一些排列分数较小的特征即冗余特征;
将上述选择的逐通道特征送入卷积神经网络中,输出预测的显著图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171615.6/1.html,转载请声明来源钻瓜专利网。