[发明专利]一种X光安检机图片物体检测方法在审
申请号: | 201811339089.9 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109472309A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 王康;曲宝珠;徐晓丽 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 杨海军 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体检测 网络基本结构 处理模块 复杂背景 概率回归 基础特征 前景背景 人眼检测 特征网络 图像处理 物体特征 噪声干扰 多尺度 回归 检测 人眼 图片 网络 | ||
1.一种X光安检机图片物体检测方法,所述方法基于FH-SMART-XRAY-NET的网络基本结构,其特征在于:所述FH-SMART-XRAY-NET的网络基本结构包括四部分组成结构,分别是X光图像基础特征提取网络、多尺度X光物体特征网络、X光图像前景背景特征网络以及类别回归、位置回归和前景概率回归处理模块;
所述FH-SMART-XRAY-NET网络基本结构首先对送入网络的图像进行尺度归一化处理,随后使用X光图像基础特征提取网络实现X光图像特征提取,所述X光图像基础特征提取网络包括基础特征层和抽象特征层,其中,基础特征层用以提取X光图像中的基础特征,抽象特征层用以提取X光图像深层次的抽象特征,获得图像整体的语意信息,抽象特征层输出的特征图分为大、中、小三个尺度;
所述多尺度X光物体特征网络是紧跟在X光图像基础特征提取网络之后的网络,通过优化X光图像基础特征提取网络输出的大、中、小三尺度特征,实现对X光图像内不同物体的检测,包括特征图反卷积处理、定义Object Candidate Area处理以及抽象特征卷积处理;
多尺度X光物体特征网络最终输出的特征图经过所述X光图像前景背景特征网络进一步优化处理,每一个特征图都被进一步卷积,产生的新特征图,新的特征图被送入算法后续阶段以判断每一个Object Candidate Area属于前景还是背景;
所述类别回归、位置回归和前景概率回归处理模块对提取到的相应特征进行类别回归、位置回归以及前景概率回归,三者总和将成为本次前向传播的损失值;在反向传播时,FH-SMART-XRAY-NET网络基本结构将根据损失值调节网络参数,使最终效果达到最优。
2.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于:所述X光图像基础特征提取网络中,基础特征层使用三层卷积;抽象特征层使用三级尺度抽象卷积,或者根据实际需求使用单尺度或多尺度抽象卷积。
3.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于:所述多尺度X光物体特征网络中,在模型训练阶段,每一个Object Candidate Area对应图像内的每一个真实值计算面积重合率,根据面积重合率的大小,Object Candidate Area将被分为正样本区域和负样本区域,供模型训练过程中的类别和位置回归使用。
4.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于:所述类别回归、位置回归和前景概率回归处理模块中,采用了Softmax回归实现类别回归,其计算方法为:
其中x(i)表示第i个输入图像的特征,y表示输出的预测图像类别,i表示第i个输入样本,j表示输出的总的图像类别数,k表示输出的图像类别数量,T表示矩阵转置符,θ表示模型的参数。
5.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于,所述类别回归、位置回归和前景概率回归处理模块中,位置回归的方法为:指在模型训练过程中,通过平移、缩放的方式不断调整预测区域的位置,最大化二者的重合面积,使得预测位置与真实值尽可能的重合。
6.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于,所述类别回归、位置回归和前景概率回归处理模块中,前景概率回归的方法为:在模型的训练过程中,对X光图像前景背景特征网络输出的特征图进行SoftMax计算,并将此部分损失值计入最后的损失函数中。
7.如权利要求1所述的一种X光安检机图片物体检测方法,其特征在于,所述类别回归、位置回归和前景概率回归处理模块中,网络对提取到的相应特征进行类别回归、位置回归以及前景概率回归,三者总和将成为本次前向传播的损失值;
在反向传播时,FH-SMART-XRAY-NET网络基本结构将根据损失值调节网络参数,FH-SMART-XRAY-NET网络基本结构的损失函数定义如下:
上式中,参数含义如下:三种Loss的权重分别占总权重的三分之一;Nfg表示的是属于前景的ObjectCandidateArea的数量;Nloc表示的是所有ObjectCandidateArea位置的数量;Ncls|fg表示的是确认是前景的条件下ObjectCandidateArea对于每个类别的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811339089.9/1.html,转载请声明来源钻瓜专利网。