[发明专利]一种基于深度学习的高性能多尺度目标检测方法在审

专利信息
申请号: 202010920608.1 申请日: 2020-09-04
公开(公告)号: CN112149665A 公开(公告)日: 2020-12-29
发明(设计)人: 潘伟航;陆佳炜;邵子睿;黄奕涵;郑薇;朱冰倩 申请(专利权)人: 浙江工业大学
主分类号: G06K9/32 分类号: G06K9/32;G06K9/62;G06N3/04;G06T3/40;G06T7/11;G06T7/187
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 性能 尺度 目标 检测 方法
【权利要求书】:

1.一种基于深度学习的高性能多尺度目标检测方法,其特征在于,所述方法包括训练过程和检测过程,

所述训练过程如下:

1.1、输入图片,生成图像块;

1.2、筛选正图像块;

1.3、筛选负图像块;

1.4、输入图像块,训练模型;

所述检测过程如下:

2.1、预测焦点像素集;

2.2、生成焦点图像块;

2.3、RoI阶段;

2.4、分类和回归;

2.5、焦点合成。

2.如权利要求1所述的一种基于深度学习的高性能多尺度目标检测方法,其特征在于,所述1.1中,所述图像块是指在任一尺度下,某图片上一系列固定大小的(K*K像素)以恒定间隔(d像素)排布的窗口,每个窗口都可能包含一个或几个目标,在尺度{S1,S2,…,Sn}下生成的图像块记作Ci,其中Sn表示第n个尺度。

3.如权利要求1或2所述的一种基于深度学习的高性能多尺度目标检测方法,其特征在于,所述1.2中,图像的正确的标注框ground-truth boxes随着图像尺度的变化进行对应的缩放,因此对于每一个尺度i,需要指定理想检测面积为i∈[1,n],分别表示理想检测面积的最小值与最大值,若某个ground-truth boxes完全位于一个图像块内,则该ground-truth boxes被图像块包围;采用贪心算法,根据图像块包围的ground-truth boxes数量,从每个尺度i中筛选图像块作为正图像块,记作其中贪心算法是一种每一步选择上都要保证能获得局部最优解的算法。

4.如权利要求3所述的一种基于深度学习的高性能多尺度目标检测方法,其特征在于,所述1.3包括以下步骤:

步骤1.3.1使用步骤1.2中筛选得到的正图像块训练一个仅有几个epochs的RPN,epochs指代所有的数据送入网络中完成一次前向计算及反向传播的过程,其中RPN是在Faster RCNN中首次提出的深度全卷积网络,该RPN仅用来选择负图像块,因此即使精度不高也几乎不会对模型最终性能产生影响;

步骤1.3.2使用该RPN检测整个训练集,根据检测结果选择负图像块,选择过程如下:

a)排除所有被正图像块包围的区域提议Region proposals,区域提议指最有可能为目标的区域;

b)在每个尺度i下使用贪心算法选择至少包含M个区域提议的图像组成负图像块池;

步骤1.3.3训练时从负图像块池中以固定数量随机选择参与训练的负图像块,表示为其中∪表示的是负图像块全集,neg指的是negative,指尺度i下的负图像块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010920608.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top