[发明专利]一种目标检测性能优化的方法有效

申请号：	201710060366.1	申请日：	2017-01-24
公开（公告）号：	CN106934346B	公开（公告）日：	2019-03-15
发明（设计）人：	段凌宇;楼燚航;白燕;高峰	申请（专利权）人：	北京大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	王庆龙
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种目标检测性能优化的方法，所述方法包括：在检测模型训练过程中，使用度量学习来调整样本在特征空间的分布，用以产生更有区分度的特征；度量学习对应的深度神经网络在迭代训练中，每一次迭代使用的候选框为通过联合交叠IoU信息确定的具有相同目标对象距离满足一定约束条件，不同目标距离满足一定约束条件的位置关系的候选框，以及；查看每一轮迭代训练产生的候选框目标的特征是否满足相似度约束条件；若满足，则检测模型在本次迭代不产生损失，不需要反向传播网络中各个层对应的输出误差；在测试时，将待检测图片和图片的候选框集合输入到训练后的检测模型中，获得该检测模型输出的目标对象坐标和类别信息。本发明的方法可以提高检测能力，优化检测性能。
搜索关键词：	一种目标检测性能优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种目标检测性能优化的方法，其特征在于，包括：在检测模型训练过程中，使用度量学习来调整样本在特征空间的分布，用以产生更有区分度的特征；在迭代训练中，所述度量学习对应的深度神经网络每一次迭代使用的候选框为：通过联合交叠IoU信息确定的具有相同目标对象距离满足一定约束条件，不同目标距离满足一定约束条件的位置关系的候选框，以及；查看每一轮迭代训练产生的候选框目标的特征是否满足相似度约束条件；若满足，则检测模型在本次迭代不产生损失，不需要反向传播网络中各个层对应的输出误差；在测试时，将待检测图片和图片的候选框集合输入到训练后的检测模型中，获得该检测模型输出的目标对象坐标和类别信息；所述方法还包括：在测试之前，将训练过程的深度神经网络的池化层采用Top‑K池化层替换；其中，所述Top‑K池化层是通过对池化窗口中获取最高的K个响应值进行平均获取的；深度神经网络的迭代训练中采用反向传播算法，需要根据计算输入对应输出的偏导数，因此在反向传播过程中，所述Top‑K池化方法对应的偏导数为：其中，Top‑K池化方法取排序过的池化窗口的前K个值，K为大于1的自然数，为在第i个池化窗口的第j个元素，表示第i个池化窗口的输出，E为损失函数计算得到的总体误差；所述方法还包括：将训练过程的度量学习对应的深度神经网络的池化层采用能够应对噪声干扰的Top‑K池化层替换；以及将测试过程的检测模型中深度神经网络的池化层采用能够应对噪声干扰的Top‑K池化层替换；其中，所述Top‑K池化层是通过对池化窗口中获取最高的K个响响应值进行平均获取的；所述每一次迭代使用的候选框为：通过联合交叠IoU信息确定的具有相同目标对象距离满足一定约束条件，不同目标距离满足一定约束条件的位置关系的候选框，包括：针对训练图片的每个局部候选框都被指定一个类别标签lclass来表示它是某一目标类别或是背景；当一个局部候选框与正确标注之间的IoU重叠超过50％，该候选框为正样本；当一个局部候选框与任意一个正确标注的IoU覆盖面积都在之间时，该候选框为负样本；是一个阈值；对每一个负样本除了lclass外，额外指定一个候选框标签lproposal为与该局部候选框覆盖面积最大的类别；针对不符合相似性约束的三元组，根据lclass和lproposal将所有局部候选框分为不同的组，得到集合(G1,G2,…，GM)；每一组G_c包括l_class＝c的正样本和l_proposal＝c的负样本；对每个组G_c，为目标对象的正确标注为l_class＝c的正样本，Rⁿ为l_class＝background并且l_proposal＝c的负样本；根据公式一选取每组Gc中的部分样本来构成三元组，组成规则是正确标注的特征，与正确标注特征距离最远的正样本和与正确标注征距离最近的负样本的特征，分别通过argmax和argmin操作来获得：公式一：分别是正确标注，正样本和负样本；约束条件为：为正确标注与正样本之间的特征相似度距离，为正确标注与负样本的特征相似度距离；α表示预设的和之间的最小距离间隔；所述查看每一轮迭代训练产生的候选框目标的特征是否满足相似度约束条件，包括：迭代训练过程中的深度神经网络损失为Ltriplet，所以深度神经网络的整体优化损失函数为：Ltotal＝ω1Lcls+ω2Lloc+ω3Ltriplet；其中，ω1，ω2，ω3分别为预设的比例值；Lcls为分类损失，Lloc为定位损失，Ltriplet局部候选框的相似度三元组损失；所述其中，分别是正确标注，正样本和负样本，α表示预设的和之间的最小距离间隔。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710060366.1/，转载请声明来源钻瓜专利网。

上一篇：车辆伤痕库及其构建方法、车辆伤痕信息显示方法及系统
下一篇：障碍物识别方法及装置、计算机设备及可读介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种目标检测性能优化的方法有效

专利文献下载