[发明专利]一种基于全卷积和长短期记忆单元的场景语义分割方法在审
申请号: | 201710739098.6 | 申请日: | 2017-08-25 |
公开(公告)号: | CN107480726A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 程建;张建;朱晓雅;张泽厚 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 成都弘毅天承知识产权代理有限公司51230 | 代理人: | 徐金琼,刘东 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于全卷积和长短期记忆单元的场景语义分割方法,涉及图像处理技术领域,包括如下步骤S1构建基于全卷积、金字塔池化模块与长短期记忆单元模块的深度神经网络;S2比对预测图像和标注图像,并以Softmax损失为目标函数、随机梯度下降为优化方法进行训练,对步骤1得到的深度神经网络进行权值更新;S3多次进行步骤S2,直到损失下降到无法下降时结束训练;S4输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。本发明解决了目前场景图像分割准确率低、图像中目标过分割和欠分割的问题。 | ||
搜索关键词: | 一种 基于 卷积 短期 记忆 单元 场景 语义 分割 方法 | ||
【主权项】:
一种基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于,包括如下步骤:S1:构建基于全卷积、金字塔池化模块与长短期记忆单元模块的深度神经网络;S2:输入场景图像,在深度神经网络中进行一次前向传播得到预测图像A;输入标注图像进行尺度缩减后得到与预测图像同分辨率的标注图像A;比对预测图像A和标注图像A,以Softmax损失为目标函数,对步骤1得到的深度神经网络进行权值更新;S3:多次进行步骤S2,直到损失无法下降时结束训练;S4:输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710739098.6/,转载请声明来源钻瓜专利网。