[发明专利]一种基于语义轮廓信息的安检图像刀具检测分割方法在审
申请号: | 201911327345.7 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111127499A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 李晓峰;张建 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/12;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 轮廓 信息 安检 图像 刀具 检测 分割 方法 | ||
1.一种基于深度学习语义轮廓信息的刀具检测分割方法,其特征在于,具体包括:
1)输入一幅大小为W*H的原始图像,对应的边缘检测图像大小与原始图像相同,W为原始图像宽度,H为原始图像的高度;
2)将原始图像内容进行边缘检测,并且对监督样本二值图mask进行边缘检测,具体步骤如下:
①优化原始图像边缘检测模型:使用HED(Holistically-Nested Edge Detection)模型对原始图像内容进行边缘检测,并保留在Side-output4阶段的边缘检测图像;
②建立mask图像最优化模型:采用Laplace算子对mask进行边缘检测,目标是让mask图像中刀具边缘像素具有不同像素,靠近边缘中心具有较大权重,距离边缘中心越远,权重越小,很大程度上能够保留刀具轮廓信息;建立两个变量的离散Laplace算子函数为:
将公式(1)写成filter mask的形式如下:
1 1 1 1 -8 1 1 1 1
公式(1)中,x、y分别为图像上x轴、y轴的坐标点;公式(1)的原始推导过程需要先定义最简单的二阶微分拉普拉斯算子,拉普拉斯算子是二阶微分线性算子,在图像边缘处理中,二阶微分的边缘定位能力更强,锐化效果更好,因此在进行图像边缘处理时,直接采用二阶微分算子而不使用一阶微分:
公式(2)中,任意阶微分都是线性操作,所以Laplace算子是一个线性算子,分别对Laplace算子x,y两个方向的二阶导数进行差分就得到了离散函数的Laplace算子;在一个二维函数f(x,y)中,x,y两个方向的二阶差分分别:
公式(2)(3)能够得出离散Laplace算子函数;
3)将原始图像和对应其边缘二值图像作为训练样本,同时输入到MaskRCNN网络中,对刀具的特征与刀具语义轮廓信息特征拼接,最后通过添加边缘语义分割任务实现多任务策略;该步骤具体包括:
①设计RPN(Region Proposal Networks)孪生网络结构,利用RPN将原始图像和对应其边缘二值图像输入到网络中,分别对刀具整体和刀具边缘信息提取特征,在ResNet网络的block5阶段进行特征拼接;目标是最有效利用刀具语义轮廓特征,让刀具重要的特征尽可能的增加权重,其中,
RPN损失函数为:
公式(4)中,Ncls表示类别数,取值为2,Nreg表示回归坐标数量,取值为4,i表示第i个锚点,pi表示锚点i预测是否为目标的概率,当锚点是正样本时负样本则为ti表示第i个锚点预测box的4个参数化坐标的矢量,表示一个与正样本锚点相关的groundtrue box坐标,超参数λ表示平衡因子,是为了平衡分类损失和回归损失,根据交叉验证来确定取值为10,Lcls表示二分类softmax损失函数,Lreg表示回归损失,使用的是Smooth-L1函数,分别为:
公式(5)中,e是自然常数,表示softmax层的前一层特征输出值,是自然常数e的指数,i表示类别索引,取值范围[1,j]的整数,j表示刀具类别数,取值为2;
公式(6)中,x表示预测框与ground truth之间的差异值;
②建立刀具边缘语义分割任务分支,与分类任务分支、检测任务分支和刀具分割任务分支并列,目标是缩短训练时间,更准确沿着边缘分割,一方面是由于神经网络的深度过大,更复杂的任务可以优化网络性能,另一方面刀具边缘语义分割任务能够影响其他的任务精度,并且是好方面影响,对于预测的二值掩膜输出,对每个像素点应用sigmoid函数,整体损失定义为平均二值交叉损失熵(average binary cross-entropy loss);引入预测K个输出的机制,允许每个类都生成独立的掩膜,避免类间竞争,目的是解耦了掩膜和种类预测;
平均二值交叉熵损失函数:
公式(7)中,i表示第i个像素,pi表示像素点i预测在刀具上的概率,当像素点在刀具上时反之则为
定义模型总损失函数:
LMRCNN=LClass+LBox+LMask+LEdge+L(pi,ti) (8)
公式(8)中,LClass损失函数为:
公式(9)中,e是自然常数,表示softmax层的前一层特征输出值,是自然常数e的指数,i表示类别索引值,取值范围[1,j]的整数,j表示刀具类别数,取值为2;
LBox损失函数同样使用Smooth-L1函数:
公式(10)中,x表示刀具预测框与ground truth之间的差异值;LMask损失函数:
公式(11)中,i表示第i个像素,pi表示像素点i预测在刀具的概率,当像素点在刀具上时反之则为
③求解该最优化模型,LMRCNN损失函数降低到稳定区间;
4)向训练好的检测分割模型进行测试,输入原始安检图像内容,进而获得刀具检测分割结果图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911327345.7/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置