[发明专利]一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法在审
申请号: | 202110875745.2 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113496228A | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 郝立颖;杨正凯 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 res2net transunet 协同 注意力 人体 语义 分割 方法 | ||
1.一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,包括如下步骤:
S1、获取人体部分语义分割数据集;
S2、引入Res2Net网络、TransUNet网络和Coordinate Attention机制,搭建神经网络模型;
S3、设计损失函数,并利用Adam算法对所述神经网络模型进行优化;
S4、采用数据集训练优化后的所述神经网络模型;
S5、输入待分割的人体图像到训练后的神经网络模型中,得到人体图像分割结果。
2.根据权利要求1所述的基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,所述获取人体部分语义分割数据集,包括:
获取CIHP人体语义分割数据集,并将数据集划分为训练数据集和验证数据集;
将训练数据集中的全部语义图片用于神经网络模型的训练;
随机抽取验证数据集中的N张图像,用于评估神经网络模型的性能,其中,N小于等于10。
3.根据权利要求1所述的基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,所述引入Res2Net网络、TransUNet网络和Coordinate Attention机制,搭建神经网络模型,包括:
搭建的神经网络模型包括编码器单元和解码器单元;
编码器单元包括Res2Net网络和TransUNet网络,Res2Net网络和TransUNet网络提取输入图像中的全局特征和局部特征,得到特征图;
解码器单元包括上采样模块和Coordinate Attention机制,解码器单元获取并合并特征图,上采样模块对特征图进行处理,Coordinate Attention机制对处理后的特征图中的特征进行聚集,以分割图像并恢复至原来的图像大小。
4.根据权利要求3所述的基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,所述Coordinate Attention机制使用两个空间范围的池化核来分别沿横坐标和纵坐标对每个通道进行编码;所述Coordinate Attention机制分别沿两个空间方向聚集特征,产生一对方向感知的特征图,这两个转换还允许注意力块沿一个空间方向捕捉长距离的依赖性,并沿另一个空间方向保留精确的位置信息。
5.根据权利要求1所述的基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,所述设计损失函数,并利用Adam算法对所述神经网络模型进行优化,包括:
定义全局的损失函数;
使用Adam算法对神经网络模型进行梯度下降;
采用动态递减学习率策略,对神经网络模型进行优化。
6.根据权利要求1所述的基于Res2Net、TransUNet和协同注意力的人体语义分割方法,其特征在于,所述采用数据集训练优化后的所述神经网络模型,包括:
设定神经网络模型的训练总数,输入图像的大小,初始学习率以及批次大小;
对优化后的神经网络模型进行训练,训练公式如下:
上式中,max_iter=212100,power=0.9,0iter212100。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时,执行所述权利要求1至6中任一项权利要求所述的方法。
8.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序运行执行所述权利要求1至6中任一项权利要求所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110875745.2/1.html,转载请声明来源钻瓜专利网。