[发明专利]一种道路目标检测方法、装置及存储介质在审
申请号: | 201910623507.5 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110472503A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 蔡晓东;郑淑婷 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 11212 北京轻创知识产权代理有限公司 | 代理人: | 黄小榆<国际申请>=<国际公布>=<进入 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征提取 道路目标 去卷积 网络 网络构建 语义信息 特征图 预测 图像特征训练 存储介质 低分辨率 高分辨率 网络包括 图像集 小目标 检测 拼接 图像 分类 融合 输出 | ||
1.一种道路目标检测方法,其特征在于,包括如下步骤:
基于SSD特征提取网络构建DSSD特征提取网络,所述DSSD特征提取网络包括所述SSD特征提取网络、去卷积层和预测层;
对所述DSSD特征提取网络进行图像特征训练,所述训练的过程包括:
所述SSD特征提取网络将输入的图像训练集进行卷积运算,得到对应的低分辨率高语义信息特征图,并生成用于确定目标图像的预测框,所述图像训练集包括多个原始特征图,
所述去卷积层分别将各个所述图像训练集中的所述原始特征图与对应的所述低分辨率高语义信息特征图进行特征拼接,得到多个特征拼接图,并对各个所述特征拼接图进行去卷积运算,
所述预测层根据预设的默认框确定各个经去卷积运算的特征拼接图为正样本或负样本,所有的所述正样本组成正样本集,并根据损失函数确定所述预测框的有效性,并根据经确定的预测框从所述正样本集中检测得到目标图像,从而完成训练;
将待识别的道路目标图像集输入训练后的DSSD特征提取网络中,输出道路目标图像。
2.根据权利要求1所述的道路目标检测方法,其特征在于,所述对各个所述特征拼接图进行去卷积处理的过程包括:
根据第一式对所述特征拼接图进行去卷积运算
其中,C表示为卷积核的稀疏矩阵,和分别表示为特征拼接图的一维向量,T表示为转置运算。
3.根据权利要求2所述的道路目标检测方法,其特征在于,所述预测层根据预设的默认框确定各个经去卷积运算的特征拼接图为正样本或负样本的过程包括:
设置Jaccard系数,所述Jaccard系数用于判断所述经去卷积运算的特征拼接图为正样本或负样本,根据所述Jaccard系数分别计算所述默认框的系数和所述经去卷积运算的特征拼接图的系数,得到默认框系数和拼接图系数,并对所述拼接图系数与所述默认框系数进行差值计算,将计算得到的差值与所述Jaccard系数进行比较,如果所述差值大于所述Jaccard系数,则所述经去卷积运算的特征拼接图为正样本,否则,所述经去卷积运算的特征拼接图为负样本。
4.根据权利要求1所述的道路目标检测方法,其特征在于,所述根据损失函数确定预测框的有效性的过程包括:
设置真实框,所述损失函数包括定位损失函数和置信损失函数,根据第二式计算所述置信损失函数和所述定位损失函数之和,得到所述真实框所对应边界框位置的预测值,根据所述预测值确定预测框的有效性,所述第二式为:
其中,Lconf(x,c)表示置信损失函数,Lloc(x,l,g)为定位损失函数,N表示正样本的数量,C表示类别置信度,L表示为真实框所对应边界框位置的预测值,g表示为特征拼接图中目标的位置参数。
5.一种道路目标检测装置,其特征在于,包括:
构建模块,用于基于SSD特征提取网络构建DSSD特征提取网络,所述DSSD特征提取网络包括所述SSD特征提取网络、去卷积层和预测层;
训练模块,用于对所述DSSD特征提取网络进行图像特征训练,所述训练的过程包括:所述SSD特征提取网络将输入的图像训练集进行卷积运算,得到对应的低分辨率高语义信息特征图,并生成用于确定目标图像的预测框,所述图像训练集包括原始特征图,
所述去卷积层分别将各个所述图像训练集中的所述原始特征图与对应的所述低分辨率高语义信息特征图进行特征拼接,得到多个特征拼接图,并对各个所述特征拼接图进行去卷积运算,
所述预测层根据预设的默认框确定各个经去卷积运算的特征拼接图为正样本或负样本,所有的所述正样本组成正样本集,并根据损失函数确定所述预测框的有效性,并根据经确定的预测框从所述正样本集中检测得到目标图像,从而完成训练;
输出模块,用于将待识别的道路目标图像集输入训练后的DSSD特征提取网络中,输出道路目标图像。
6.根据权利要求5所述的道路目标检测装置,其特征在于,所述去卷积层具体用于:
根据第一式对所述特征拼接图进行去卷积运算
其中,C表示为卷积核的稀疏矩阵,和分别表示为特征拼接图的一维向量,T表示为转置运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910623507.5/1.html,转载请声明来源钻瓜专利网。