[发明专利]一种基于改进U-NET网络的图像语义分割方法在审
申请号: | 201910794746.7 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110503052A | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 黄进;刘子仪;朱明仓;李剑波 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 11350 北京科亿知识产权代理事务所(普通合伙) | 代理人: | 汤东凤<国际申请>=<国际公布>=<进入 |
地址: | 610031 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像特征 尺度 图像语义 映射结果 预测结果 分割 编码结果 航拍图像 输入图像 融合 多通道 可视化 上采样 下采样 映射 准确率 低维 高维 卷积 叠加 改进 空洞 转换 网络 图片 | ||
本发明公开了一种基于改进U‑NET网络的图像语义分割方法,包括:步骤1:对输入图像依次进行不同尺度的下采样,并提取不同尺度的图像特征;步骤2:对所提取各尺度的图像特征分别进行空洞卷积操作,之后进行图像特征融合;步骤3:对融合后的图像特征进行通道叠加,并从高维特征逐一映射到低维特征,生成多通道的映射结果;步骤4:对各尺度的映射结果进行上采样,获得预测结果,对预测结果可视化,将one‑hot编码结果转换为可见的图片。本发明基于改进U‑net的图像语义分割方法,将其运用于航拍图像分割问题上,较U‑net有更好的识别准确率。
技术领域
本发明属于图像分割技术领域,具体涉及一种基于改进U-NET网络的图像语义分割方法。
背景技术
深度学习领域的U-net神经网络最开始是用于医学图像领域。由于U-net神经网络有着很多优点,于是很多学者将其迁移使用到了其他计算机视觉领域上,发现其在不同的图像处理上仍然表现出优异的性能,并在多项相关图像处理比赛上远远超越其他算法,长期位居多项榜首。
发明内容
本发明的目的是将U-net神经网络运用于无人机图像的处理上,提供了一种基于改进U-NET网络的图像语义分割方法。
本发明基于U-net神经网络对无人机航拍的俯瞰图片进行像素级的语义分割,来达到识别地物种类及其所包含的像素。在使用U-net神经网络对航拍图像进行语义分割时发现,若使用传统的U-net神经网络,预测精度还有待提高。因此本发明对传统U-net神经网络做了相应改进。
本发明提供的一种基于改进U-NET网络的图像语义分割方法,包括:
步骤1:对输入图像依次进行不同尺度的下采样,并提取不同尺度的图像特征;
步骤2:对所提取各尺度的图像特征分别进行空洞卷积操作,之后进行图像特征融合;
步骤3:对融合后的图像特征进行通道叠加,并从高维特征逐一映射到低维特征,生成多通道的映射结果;
步骤4:对各尺度的映射结果进行上采样,获得预测结果,对预测结果可视化,将one-hot编码结果转换为可见的图片。
进一步的,步骤1中,利用2×2的最大池化对输入图像进行不同尺度的下采样。
进一步的,步骤3中,利用2×2的反卷积来进行逐一映射。
进一步的,以上步骤中的所有普通卷积和空洞卷积操作之前均进行补零操作。
本发明基于改进U-net的图像语义分割方法,将其运用于航拍图像分割问题上,用同样的小样本数据集进行训练、验证、测试,发现改进后的atrous-unet网络较U-net有更好的识别准确率,能够达到73%以上。
附图说明
图1为传统的U-net神经网络结构示意图;
图2为改进的U-net神经网络结构示意图;
图3为实施例中下采样示意图;
图4为普通卷积和空洞卷积的对比示意图;
图5为实施例中反卷积示意图;
图6为实施例中的训练样本;
图7为实施例中的测试样本;
图8~9为实施例中采用传统U-net神经网络的图像分割结果;
图10~11为实施例中采用改进U-net神经网络的图像分割结果。
具体实施方式
为便于理解本发明,下面将对本发明技术原理、实施过程及技术效果进行详细说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910794746.7/2.html,转载请声明来源钻瓜专利网。