[发明专利]一种基于YOLACT实例分割的改进方法在审
申请号: | 202110341105.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113160263A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 贾宇明;齐晨阳;毛晨;王云;罗俊海;鲜维富;唐昊 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06T7/136 | 分类号: | G06T7/136;G06T3/40;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolact 实例 分割 改进 方法 | ||
本发明属于图像实例分割领域,具体涉及一种基于YOLACT实例分割的改进方法。随着目标检测和语义分割任务的发展,作为两者任务的结合体实例分割任务也越来越多的受到研究者们的关注,但目前为止实例分割任务依然没有达到令人满意的效果。实例分割任务主要受限于两个评价指标:精度和时间复杂度。虽然YOLACT实例分割算法达到了实时性,但精度却达不到一个较好的水平。因此本文对YOLACT算法进行了相应改进,提高的网络的精度。综合考虑准确性和实时性本发明都具备了较好的效果。
技术领域
本发明属于图像实例分割领域,具体涉及一种基于YOLACT实例分割的改进方法。
背景技术
目标检测及定位是图像处理中从粗糙到精细的过程。它不仅需要给出图像中每个对象的类别,还要给出对象的具体位置,位置的表示可以分为对象的包围框或者对象的质心。语义分割通过预测输入图像中每个像素的类别来进行类别间的划分。实例分割为属于同一个类的对象的不同实例提供了不同的标签。换言之语义分割只对整幅图进行像素点的预测,不区分不同实例,将不同实例都认为是一个类别。而实例分割在语义分割的基础上增加了区分同类不同实例的功能。因此,实例分割可以定义为同时解决了目标检测识别和语义分割问题的一种技术。
发明内容
本发明要解决的技术问题是:对YOLACT实例分割算法进行改进,改进后算法的精度比原算法更高。
本发明基于YOLACT实例分割的改进方法,包括以下步骤:
步骤1:输入一张图像,对图像进行特征提取;
步骤2:对提取到的特征进行特征融合;
步骤3:通过掩码生成网络生成图像的原始掩码;
步骤4:通过注意力机制筛选融合后的特征;
其中步骤4的具体步骤为:
步骤401:将特征进行多尺度池化,池化到大小为1×1、3×3和5×5的结果,池化方式采用平均池化方式;
步骤402:对池化后的结果进行上采样,上采样到大小为5×5,上采样方式采用双线性插值法;
步骤403:对三个5×5的上采样结果求和,求和方式采用逐元素加法;
步骤404:进行四次卷积操作来预测注意力权重参数,第一次进行1×1卷积操作,将通道维度进行压缩,减小后续的计算量,第二次和第三次进行3×3卷积操作,第四次进行1×1卷积操作,并在前三次卷积后使用ReLU激活函数,增加预测的非线性度,但在第四次卷积后使用Sigmoid激活函数,将预测的权重参数归一化到0~1区间;
步骤405:求预测的权重参数与特征的积;
步骤5:通过预测网络预测实例的位置、类别和掩码系数;
步骤6:通过掩码系数和原始掩码获得实例的掩码;
步骤7:通过掩码抑制算法对实例掩码进行处理;
其中步骤7的具体步骤为:
步骤701:遍历掩码图上所有的像素点,对每个像素点在掩码图中求最大值,并将得到的掩码编号保存在maxMask变量中,如果像素点不属于任何一个实例则值为0;
步骤702:用maxMask和每个实例掩码求交集,如果maxMask像素点的值和某个掩码编号相同,那么当前掩码保留该像素点的值,即该像素点属于此掩码;如果maxMask像素点上的值与当前掩码编号不对应,那么当前掩码上该像素点的值设置为0;
步骤8:裁剪及二值化处理。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110341105.3/2.html,转载请声明来源钻瓜专利网。