[发明专利]物联网应用中图像语义分割方法在审
申请号: | 202110667652.0 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113516668A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 赵哲;李龙飞;林予松;李英豪;赵紫茹;张悦 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T7/155;G06K9/62;G06N3/04;G06N3/08;G06T5/30;G06T5/50 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 张成文 |
地址: | 450000 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联网 应用 图像 语义 分割 方法 | ||
本发明公开了一种物联网应用中图像语义分割方法,本发明包括基于深度学习的图像语义分割和基于区域分类的图像语义分割,在基于深度学习的图像语义分割中,结合DNN先将原始图像划分成不同的目标候选区域,得到一系列图像块,再利用DNN对图像块或图像块中的每个像素进行语义分类,最后根据分类结果对原始图像进行标注,得到最终分割结果;在基于区域分类的图像语义分割中,包括应用基于候选区域的方法和基于分割掩膜的方法,基于候选区域的方法首先利用相应的算法生成大量候选区域并筛选出合理的候选区域,再运用CNN对每个候选区域提取图像特征和语义信息,利用分类器对候选区域中的图像块或像素进行分类,最后输出分割结果。
技术领域
本发明属于物联网应用技术领域,具体涉及一种物联网应用中图像语义分割方法。
背景技术
目前计算机视觉图像中,主流的高性能模型训练依靠大量有标签数据,但是这种带标签的数据成本高,且难以跟上数据增长的速度。因此,针对目前领域中这一重要问题,研究高性能的半监督图像分类算法,使得模型训练能够有效地利用无标签数据中的潜在信息。现有的物联网应用场景中基于半监督图像分类,图像语义分割方法还不够优化。
发明内容
为了克服现有的技术存在的不足,本发明提供一种物联网应用中图像语义分割方法。本发明解决其技术问题所采用的技术方案是:
物联网应用中图像语义分割方法,包括基于深度学习的图像语义分割和基于区域分类的图像语义分割,在基于深度学习的图像语义分割中,结合DNN先将原始图像划分成不同的目标候选区域,得到一系列图像块,再利用DNN对图像块或图像块中的每个像素进行语义分类,最后根据分类结果对原始图像进行标注,得到最终分割结果;在基于区域分类的图像语义分割中,包括应用基于候选区域的方法和基于分割掩膜的方法,基于候选区域的方法首先利用相应的算法生成大量候选区域并筛选出合理的候选区域,再运用CNN对每个候选区域提取图像特征和语义信息,接着利用分类器对候选区域中的图像块或像素进行分类,最后输出分割结果;基于分割掩膜的方法包括,首先,在图像中检测出所有潜在的目标候选对象,将原图像划分为一系列大小不等的图像块,每个图像块包含一个潜在的目标候选对象;将产生的图像块送入CNN进行处理,其每个像素经过“是否属于该目标候选对象”的二分类判断后得到分割掩膜,再将多张分割掩膜进行优化处理得到最终分割结果。运用CNN对每个候选区域提取图像特征和语义信息包括:
建设CNN:选用第一级网络模型、第二级网络模型和第三级网络模型,第一级网络模型的所有网络层的参数随机初始化;用预学习过的权重初始化第二级网络模型;用预学习过的VGG卷积网络的权重初始化第三级网络模型,第二级网络模型和第三级网络模型其他网络层参数随机初始化;对CNN进行学习:利用数据扩充后的学习数据库中物联网数据图及其对应的分类标签图像,对第一级网络模型、第二级网络模型和第三级网络模型,分别进行迭代学习;每迭代若干次后分别用学习过的第一级网络模型、第二级网络模型和第三级网络模型对实验数据库进行验证,当三个网络模型的验证结果的准确率均达到阈值时停止学习,获取学习好的三个网络模型;将待实验的物联网数据图分别输入到学习好的第一级网络模型、第二级网络模型和第三级网络模型获取语义分割图;对获取的语义分割图然后完成决策融合,然后进行腐蚀、膨胀、开运算、闭运算、击中、细化和粗化处理获取语义分割图。
选用第一级网络模型、第二级网络模型和第三级网络模型分别选择ICNet模型、PSPNet模型和基于编码器表示的连接网络模型。
建设CNN前:构建学习数据库和实验数据库:获取物联网数据图以及每页物联网数据图对应的分类标签图像,构成数据库;选择大部分的数据图作为学习数据库,其余的数据图作为实验数据库;对学习数据库进行预处理;对学习数据库进行数据平衡处理,获取数据平衡处理后的学习数据库;随机改变学习数据库中的物联网数据图清晰度、对比度和色度,获取数据扩充处理后的学习数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110667652.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序