[发明专利]一种图像语义分割方法、电子设备和可读存储介质有效

专利信息
申请号: 201910684190.6 申请日: 2019-07-26
公开(公告)号: CN110428428B 公开(公告)日: 2022-03-25
发明(设计)人: 陈沅涛;陶家俊;王进;王磊;张建明;陈曦;邝利丹;谷科;刘林武;王志 申请(专利权)人: 长沙理工大学
主分类号: G06T7/11 分类号: G06T7/11
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 赵琴娜
地址: 410114 湖南省*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 语义 分割 方法 电子设备 可读 存储 介质
【权利要求书】:

1.一种图像语义分割方法,其特征在于,包括:

通过高斯函数对原始图像进行预处理生成若干层不同分辨率的图像,形成图像金字塔;

将所述图像金字塔输入训练好的全卷积网络模型中,所述全卷积网络模型由与所述图像金字塔层数同数量的全卷积VGG16模型并联构建,并在后端设有转置卷积层,每一所述全卷积VGG16模型的第11至14个卷积层为空洞卷积,所述图像金字塔的每一层分别输入一个所述全卷积VGG16模型,对于相邻的两层全卷积VGG16模型,上层的输出特征均与下层第5个最大池化层的输出特征融合,然后依次输入该下层的后续卷积层,得到该下层的输出特征,如此自顶向下逐层融合至底层,底层的输出特征输入所述转置卷积层,得到跟原始图像等尺寸的得分图;

将所述得分图送入训练好的全连接条件随机场,联合图像中各像素的空间位置信息和颜色向量信息进行优化处理,获取语义分割效果。

2.根据权利要求1所述的图像语义分割方法,其特征在于,所述全卷积网络模型训练中,利用与图像金字塔中各层图像等分辨率的理想分割图标签来监督每一层提取的输出特征,改进损失函数。

3.根据权利要求1所述的图像语义分割方法,其特征在于:

每一所述全卷积VGG16模型的第11至14个卷积层的扩张率依次为2、4、8、16,前三个最大池化层步幅为2,后两个最大池化层步幅为1,所述转置卷积层步幅为8。

4.根据权利要求3所述的图像语义分割方法,其特征在于,特征融合策略如下:

对于相邻的两层全卷积VGG16模型,利用双线性插值法对上层的输出特征进行步幅为2的空间上采样,再输入扩张率为2的3×3空洞卷积操作,所得特征与下层第5个最大池化层的输出特征进行串联拼接,然后依次输入该下层的后续卷积层,得到该下层的输出特征。

5.根据权利要求1所述的图像语义分割方法,其特征在于,全连接条件随机场的建模过程如下:

根据像素i和像素j的颜色向量Ii和Ij以及空间位置pi和pj定义两个核函数kc和kp分别为:

得到双核势函数为:

k(fi,fj)=w(1)kc+w(2)kp

式中,w(1)为kc核函数项的权重,w(2)为kp核函数项的权重,θα、θβ和θγ均为超参数;

利用高维滤波算法对kc、kp和k(fi,fj)中的参数进行交叉验证,直至模型收敛。

6.一种电子设备,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;

所述至少一个存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-5任一项所述的图像语义分割方法。

7.一种可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序被处理执行时,实现如权利要求1-5中任一项所述的图像语义分割方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910684190.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top