[发明专利]一种多个小目标的自动准确检测方法在审
申请号: | 202010407732.8 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111738070A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 黄翰;黄黎龙;李刚;徐杨;郝志峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多个小 目标 自动 准确 检测 方法 | ||
1.一种多个小目标的自动准确检测方法,其特征在于,包括如下步骤:
S1生成多类别的训练集和测试数据集,对图像数据进行标定,记录类别序号及位置信息;
S2对图像数据进行预处理,所述预处理包括标准化和归一化处理,对预处理后的图像数据进行压缩,然后重叠分块,得到多张小图像,对其序列进行编号;
S3采用基于caffe框架的VGGNet模型作为基础网络,在基础网络中添加从大到小的卷积层用于预测图像中物体的位置信息,通过迭代训练数据集,不断迭代优化损失函数,得到物体检测模型;
S4在物体检测模型中添加dropout结构,对dropout结构输出的特征向量进行rescale操作,来保证数据归一化后数据的分布相同;
S5将训练得到的caffemodel文件和网络结构描述文件共同打包成Jar包,封装成SDK;
S6对分块后的序列图像进行合并,并进行非极大值抑制,输出该图的检测框结果。
2.根据权利要求1所述的自动准确检测方法,其特征在于,所述S1生成多类别的训练集和测试数据集,对图像数据进行标定,记录类别序号及位置信息,具体为:
S1.1每个类别制定类别名;
S1.2对所有的图像文件进行标定,标定出图像中出现的物体信息,包括类别和位置信息;
S1.3根据标定的xml文件和图片文件生成训练数据和测试数据描述文件。
3.根据权利要求1所述的自动准确检测方法,其特征在于,所述S2重叠分块,得到多张小图像的检测,具体为:
S2.1根据小目标物体的大小将整张图像进行n*n的分块,分配序列号1至n*n;
S2.2对于长宽分别为l和w的图像,截取图像长从l/2n到l-l/2n,宽从w/2n到w-w/2n的部分,将该图像进行(n-1)*(n-1)的分块,分配序列号n*n+1至n*n+(n-1)*(n-1);
S2.3将分块后的n*n+(n-1)*(n-1)张序列图像和原图一同作为对应的训练集和测试集进行物体检测。
4.根据权利要求1所述的自动准确检测方法,其特征在于,所述S3采用基于caffe框架的VGGNet模型作为基础网络,在基础网络中添加从大到小的卷积层用于预测图像中物体的位置信息,通过迭代训练数据集,不断迭代优化损失函数,得到物体检测模型,具体为:
物体检测模型的损失函数为:
损失函数由位置损失Lloc(x,l,g)和类别置信度损失Lconf(x,c)加权而得,其中α表示权重项,根据交叉验证求出为1,其中l为前向传播后网络输出的位置坐标,g为真实训练数据框选的物体位置坐标,Lloc(x,c)为通过预测类别和真实类别计算得到的损失函数;
在网络结构后面的从大到小的卷积层中,每次迭代选用6个待预测的候选框,其中每一个特征图对应的候选框的面积计算公式如下:
其中,Smin取值为0.2,Smax取值为0.95,k∈[1,m],再选择不同比例的default box,用αr表示不同长宽比的参数:则每一个default boxe的长宽即可被计算出来:
5.根据权利要求1所述的自动准确检测方法,其特征在于,添加dropout结构后网络节点计算公式为:
Bernoulli(p)
上述公式中Bernoulli函数是伯努利分布,指的是对于随机变量r,有参数为p(0p1),分别以概率p和1-p取1和0为值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010407732.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种免疫相关性肺炎预测模型的训练方法
- 下一篇:一种智能工具箱及控制方法