[发明专利]基于图注意力网络的混凝土坝缺陷图像描述自动生成方法有效
申请号: | 202210664943.9 | 申请日: | 2022-06-13 |
公开(公告)号: | CN114898121B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 隋佳宏;周华;迟福东;毛莺池;陈豪;万旭;赵欢;庞博慧;余记远;郭锐;吴光耀;王顺波 | 申请(专利权)人: | 河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/42;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 网络 混凝土 缺陷 图像 描述 自动 生成 方法 | ||
1.一种基于图注意力网络的混凝土坝缺陷图像描述自动生成方法,其特征在于,包括如下步骤:
1)全局特征和网格特征提取,利用多层卷积神经网络分别提取缺陷图像的全局特征和网格特征;
2)构建网格特征交互图,将全局特征和网格特征作为节点输入;
3)全局特征和网格特征更新,利用图注意力网络更新优化2)中构建的网格特征交互图中的节点信息,得到更新后的全局特征和网格特征;
4)基于Transformer的解码模块利用更新后的全局特征和网格特征序列自动生成图像描述;
所述3)中,基于网格特征交互图的图注意力网络:结合网格特征交互图和图注意力网络,将图注意力网络的节点与缺陷图像的网格相对应,节点的特征为局部图像嵌入,图的边对应网格特征交互图的边,并且利用多头自注意力机制对网格特征交互图中相邻节点的缺陷信息进行融合更新。
2.根据权利要求1所述的基于图注意力网络的混凝土坝缺陷图像描述自动生成方法,其特征在于,所述1)中,利用在Visual Genome数据集上预训练的Faster R-CNN模型进行全局特征和网格特征提取,Faster R-CNN模型使用步长为1的卷积层C5和带有两个FC层的1×1RoIPool作为检测头,其中C5层的输出作为缺陷图像的网格特征。
3.根据权利要求1所述的基于图注意力网络的混凝土坝缺陷图像描述自动生成方法,其特征在于,所述2)中,引入网格特征之间的依赖关系和全局特征,借助全局节点机制建立网格特征交互图,构建网格特征交互图过程为:将1)得到的全局特征和网格特征作为网格特征交互图的节点输入,得到一个全局节点和多个局部节点;全局节点用作虚拟中心,与图中的所有节点连接;局部节点根据网格的相对中心坐标建立连接,即将两个相邻的网格节点i和j在邻接矩阵A中的值(i,j)赋为1,表示直接交互,不相邻的节点则赋为0,表示无交互;全局节点从局部节点中收集并分发通用信息。
4.根据权利要求1所述的基于图注意力网络的混凝土坝缺陷图像描述自动生成方法,其特征在于,所述1)中,利用多层卷积神经网络提取缺陷图像的网格特征和全局特征,进行图像编码:在融合各网格特征的基础上加入特征图的全局特征,提取缺陷图像的全局特征和网格特征;定义输入为一幅缺陷图像p0=full_image和n个固定大小的网格Grids=(p1,p2,...,pn),利用在Visual Genome数据集上预训练的Faster R-CNN模型进行缺陷特征提取,使用步长为1的卷积层C5和带有两个FC层的1×1RoIPool作为检测头,其中C5层的输出作为提取的缺陷图像嵌入IE0:n=CNN(p0:n;ΘCNN);其中,ΘCNN表示CNN模型的参数,IE包括全局图像嵌入IEGlobal=IE0和局部图像嵌入IELocal=[IE1,IE2,...,IEn]。
5.根据权利要求1所述的基于图注意力网络的混凝土坝缺陷图像描述自动生成方法,其特征在于,所述4)中,Transformer的解码模块包括基准解码模块和优化解码模块,基准解码模块和优化解码模块的训练都分为两个阶段:交叉熵损失优化阶段和强化学习阶段;其中,交叉熵损失优化阶段基于负对数似然估计的损失函数;强化学习阶段基于强化学习的优化策略,将CIDEr得分作为奖励函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司,未经河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210664943.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像特征提取装置及方法
- 下一篇:L形木条切割设备及切割方法