[发明专利]基于自监督低秩网络的半监督图像语义分割方法及装置有效
申请号: | 202110396330.7 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113222998B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 朱鹏飞;潘俊文;徐玮毅;王汉石;赵帅;胡清华 | 申请(专利权)人: | 天津大学;中汽数据(天津)有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04;G06N3/08;G06K9/62;G06V10/762 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 网络 图像 语义 分割 方法 装置 | ||
1.一种基于自监督低秩网络的半监督图像语义分割方法,其特征在于,所述方法包括:
构建自监督低秩网络,将来自两个分支的掩码分别进行逆几何变换,利用优化模块产生伪掩码输入到LR低秩模块;
输入N个特征X与K个初始化基,采用迭代注意机制寻找一组最优基μ和赋值矩阵P,在每次迭代中,通过softmax归一化注意力和温度系数来计算赋值矩阵P;
通过聚合输入特征X来更新最优基μ,在V次迭代之后,收敛的赋值矩阵P和最新的最优基用于重建输入特征X;
添加了由两个卷积层组成的辅助解码器来预测粗类激活图,获取类别为C的softmax规范化的类激活图A和深特征X1后,通过加权平均值计算第k个初始化基;
在基初始化过程中使用由分类损失和伪掩码分割损失构成的目标函数进行监督,对LR低秩模块的输出结果进行解码和优化,根据损失对自监督低秩网络进行更新;
其中,所述自监督低秩网络为:
将已建立的编码器-解码器分段网络扩展为共享权重的孪生神经网络结构;
将来自某一图像的两个增强视图作为输入,编码器网络处理视图并生成特征映射,该特征映射作为LR低秩模块的输入,重新估计特征映射后,将具有LR特性的特征分别反馈给解码器网络,来预测掩码。
2.根据权利要求1所述的一种基于自监督低秩网络的半监督图像语义分割方法,其特征在于,所述方法包括:对两个分支的掩码分别进行交叉视图掩码正则化处理。
3.根据权利要求1所述的一种基于自监督低秩网络的半监督图像语义分割方法,其特征在于,所述伪掩码为:
其中,分别为两个视图的几何变换,T为逆变换,为掩码M1通过视图I1的逆几何变换,为掩码M2通过视图I2的逆几何变换,为优化模块。
4.根据权利要求1所述的一种基于自监督低秩网络的半监督图像语义分割方法,其特征在于,所述通过聚合输入特征X来更新最优基μ具体为:
其中,ωn,k为xn到μk的赋值权重,Pn,k为xn到μk的赋值,Pm,k为xm到μk的赋值,xn为第n个特征,N为特征个数,μk为第k个初始化基。
5.根据权利要求1所述的一种基于自监督低秩网络的半监督图像语义分割方法,其特征在于,所述方法还包括:对所述LR低秩模块引入交叉视图正则化,用于加强两个视图的赋值矩阵之间的一致性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;中汽数据(天津)有限公司,未经天津大学;中汽数据(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110396330.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序