[发明专利]一种基于残差网络的道路图像多尺度边缘检测模型及方法在审
申请号: | 202011007469.X | 申请日: | 2020-09-23 |
公开(公告)号: | CN112085756A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 王洪剑;陈涛;黄向军;林江;孙国梁 | 申请(专利权)人: | 清华大学苏州汽车研究院(相城) |
主分类号: | G06T7/13 | 分类号: | G06T7/13 |
代理公司: | 上海国智知识产权代理事务所(普通合伙) 31274 | 代理人: | 潘建玲 |
地址: | 213000 江苏省苏州市相*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 道路 图像 尺度 边缘 检测 模型 方法 | ||
1.一种基于残差网络的道路图像多尺度边缘检测模型,包括:
数据集构建模块,用于利用各种行驶道路的图像构建用于模型训练用的数据集;
训练样本加载模块,用于在训练时批量加载训练样本,并于加载时将图像尺寸裁剪为同等大小,输入到多尺度边缘检测网络;
多尺度边缘检测网络,用于在训练时通过不同层之间输出结果的相互约束来帮助网络的不同层学习检测不同尺度的图像边缘特征,最终使网络由浅层到深层能够检测从小尺度到大尺度的图像边缘。
2.如权利要求1所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:所述数据集构建模块通过对自动驾驶和智能监控中车辆抓拍到的行驶道路图像以及人工标注了图像边缘的二值图像,构建用于模型训练用的数据集。
3.如权利要求2所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:所述数据集中的数据以行驶道路图像和对应的二值图像作为一个训练样本,每个训练样本中的行驶道路图像用于输入到多尺度边缘检测网络,人工标注的图像边缘的二值图像用于网络训练时用来作为标签真值。
4.如权利要求2所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:所述多尺度边缘检测网络基于残差网络Resnet34,通过去掉残差网络Resnet34中的全连接层、一开始的7×7的卷积层以及两个池化层,并将其根据通道数分为4个block,并在前三个block后分别加入一个2×2的最大值池化层形成。
5.如权利要求4所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:在每个block中将各层卷积层的输出使用一层反卷积扩大到输入图像大小,然后将输出相加,最后通过两个1×1的卷积输出两个结果,所述该多尺度边缘检测网络共有8个输出,每个输出都是一张预测的边缘图像。
6.如权利要求5所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于,所述8个输出的标签数据计算如下:从浅层block1到深层block4,每个block取一个输出,对block1的输出使用输入图像的标签图作为真值图进行训练,对block2的输出则将输入图像的标签图减去上述block1的输出之后作为真值图进行训练,对block3的输出为输入图像的标签图减去前两个block的输出之后作为真值图进行训练,对block4的输出为输入图像的标签图减去前三个block的输出作为真值图进行训练;各个block的另一个输出,则从深层的block4开始,使用输入图像的标签图作为真值图进行训练。
7.如权利要求6所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:所述多尺度边缘检测网络最终对图像的边缘检测结果为所述8个block输出的融合。
8.如权利要求7所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于,所述融合为:将所述8个输出的预测边缘图像堆叠到一起,形成一个八通道的特征图,然后使用1×1×1的卷积核卷积生成最终的边缘预测图像。
9.如权利要求8所述的一种基于残差网络的道路图像多尺度边缘检测模型,其特征在于:所述训练使用的损失函数为交叉熵损失,损失函数由所述8个block输出以及最终输出与真值图计算求和得到。
10.一种基于残差网络的道路图像多尺度边缘检测方法,包括如下步骤:
步骤S1,利用各种行驶道路的图像构建用于模型训练用的数据集;
步骤S2,批量加载训练样本,并于加载时将图像尺寸裁剪为同等大小,输入到多尺度边缘检测网络中;
步骤S3,构造交叉熵损失函数,并构造SGD优化器;
步骤S4,将训练样本批量输入到多尺度边缘检测网络中,使用步骤S3所构造的损失函数计算损失,并使用S3构造的优化器进行反向传播更新网络参数。
步骤S5,多次重复上述步骤S2到步骤S4,对网络进行迭代优化,直到训练完毕,得到最终的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学苏州汽车研究院(相城),未经清华大学苏州汽车研究院(相城)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011007469.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序