[发明专利]基于多头注意力机制的多阶段深度网络室内场景识别方法在审
申请号: | 202211017228.2 | 申请日: | 2022-08-23 |
公开(公告)号: | CN115424123A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 陈略峰;段文浩;吴敏;李敏 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/44;G06V10/764;G06V10/77;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 王佩 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多头 注意力 机制 阶段 深度 网络 室内 场景 识别 方法 | ||
1.一种基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,包括以下步骤:
S1:获取室内场景的数据集,并将数据集按比例分为训练集和测试集;
S2:对训练集中的室内场景图像进行预处理和数据增强处理,得到增强后的图像;
S3:将增强后的图像输入到3层不同步长的卷积层网络中进行下采样,减小图像的大小,同时保留更多的特征信息和局部信息;
S4:将S3中提取到的特征信息输入到主干网络中,利用深度卷积和多头自注意力机制,采用多阶段的训练方式进行深度特征提取,得到深度特征信息;
S5:将深度特征信息依次输入池化层、全连接层和分类器中,得到最终权值和训练完成的分类器;
S6:利用训练完成的分类器和最终权值对测试集中的室内场景图像进行测试,从而确定室内场景类别。
2.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S1中,所述获取室内场景的数据集的步骤,包括:
利用情感机器人进行常见室内交互环境的场景图像数据收集,并与IndoorCVPR_09相关数据集合并制作室内场景的数据集。
3.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S2中,使用Trivialaugmentation方法对预处理后的室内场景图像进行数据增强处理,具体包括:
增加一个数据增强函数的集合A作为输入,集合A的数据增强函数包括旋转、平移、翻转、均衡、像素值翻转和亮度,每个数据增强函数都有其对应的增强范围{0,1,2…,N};
从A中随机采样一个数据增强函数,并从增强范围{0,1,2…,N}中均匀采样一个值作为强度m,其中N表示任意正整数,根据强度m对输入图像进行数据增强,并返回增强后的图像。
4.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S3中,所述将增强后的图像输入到3层不同步长的卷积层网络中进行下采样的步骤,包括:
将增强后的图像作为输入图像,输入到3层不同步长的卷积层网络中;
第一个卷积层使用3x3,步长为2的卷积,输出通道为32,对输入图像进行一次下采样的操作,减小输入图像的大小,保留更多的特征信息;
将前一个卷积层的输出作为输入,使用两层3x3,步长为1的卷积,获得更好的局部信息。
5.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S4中,所述主干网络分为四个阶段来生成不同尺度的特征图,为了产生分层表示,在每个阶段之前添加一个2x2,步长为2的卷积层,以减小中间特征的大小,并将其投影到更大的维度;
每个阶段中,在多头注意力机制前还有一个深度卷积层DW,深度卷积层用于局部特征的提取,同时减少计算量;多头注意力机制用于动态调整权重值,得到更多的局部特征信息以及全局特征信息。
6.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S5中,以一个全局平均池化层、一个全连接层和一个带有softmax的1000路分类层结束,得到最终权值和训练完成的分类器。
7.根据权利要求1所述的基于多头注意力机制的多阶段深度网络室内场景识别方法,其特征在于,步骤S6中,所述利用训练完成的分类器和最终权值对测试集中室内场景图像进行测试的步骤,包括:
将测试集中室内场景图像作为待检测图像输入训练完成的分类器中;
根据预设的要求调整所述待检测图像的尺寸大小,生成第一检测图像;
将所述第一检测图像输送至主干网络中进行深度特征提取和匹配识别,生成分类识别信息以及分类识别信息对应的分类概率值;
判断所述分类概率值是否大于预设的分类概率阈值,若是,则将所述检测框和分类识别信息作为识别的分类结果;若否,则继续进行其余分类概率值比较,直至分类概率值大于预设的分类概率阈值,得到识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211017228.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蜜丸生产工艺
- 下一篇:一种利于脱模的液压机及其使用方法