[发明专利]基于YOLOv3和OpenCV的目标检测与定位方法在审
申请号: | 202010386129.6 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111563458A | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 赵江;强祺昌;蔡志浩;王英勋 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/73;G06N3/04;G06N3/08 |
代理公司: | 北京航智知识产权代理事务所(普通合伙) 11668 | 代理人: | 陈磊;张桢 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 yolov3 opencv 目标 检测 定位 方法 | ||
1.一种基于YOLOv3和OpenCV的目标检测与定位方法,其特征在于,包括如下步骤:
S1:利用试验平台采集待检测目标的图像;所述试验平台由四旋翼飞行器搭载开发板、飞行控制系统和单目摄像头得到;
S2:将采集的待检测目标的图像输入缩小网络结构输出尺度后的YOLOv3算法,利用训练好的YOLOv3目标检测模型进行目标检测,获得待检测目标的图像坐标;
S3:将获得的待检测目标的图像坐标输入基于OpenCV的SolvePnP算法,解算出待检测目标的世界坐标,实现空间定位。
2.如权利要求1所述的目标检测与定位方法,其特征在于,所述YOLOv3目标检测模型的训练过程,包括如下步骤:
SS1:利用所述试验平台采集待检测目标的图像作为训练数据集;
SS2:将所述训练数据集输入YOLOv3算法进行训练;
SS3:对训练输出结果进行归一化处理后,输入YOLOv3算法再次进行训练;
SS4:步骤SS3重复多次后,获得训练好的YOLOv3目标检测模型。
3.如权利要求2所述的目标检测与定位方法,其特征在于,步骤SS3中的归一化处理,具体包括:
输入:
X=x1,...,xm (1)
归一化过程:
输出:
其中,X表示上一次训练输出结果,x1表示第一次训练输出结果,xm表示第m次训练输出结果,xi表示第i次训练输出结果,表示上一次训练输出结果的估计;γ,β表示学习参数;i为整数,表示训练批次;m为大于1的整数,表示训练总批次大小;ε表示接近于0的极小值;μβ表示每个训练批次中X的均值;表示每个训练批次中X的方差;yi表示对xi归一化后的结果。
4.如权利要求2所述的目标检测与定位方法,其特征在于,训练格式选取为VOC2007数据集。
5.如权利要求1所述的目标检测与定位方法,其特征在于,缩小YOLOv3算法网络结构的输出尺度,具体包括:
原始YOLOv3算法通过下采样方式得到13×13×75、26×26×75和52×52×75三种尺度下的检测结果;其中,13、26和52代表下采样的三种尺度;75拆分为3×(4+1+20),3代表每个尺度有3个检测box,4代表每个检测box的偏移信息,1代表每类检测识别率,20代表检测出20类目标;对YOLOv3算法网络结构进行修改,使修改后的YOLOv3算法网络结构只进行单类检测,得到13×13×18、26×26×18和52×52×18三种尺度的输出。
6.如权利要求1所述的目标检测与定位方法,其特征在于,步骤S3,将获得的待检测目标的图像坐标输入基于OpenCV的SolvePnP算法,解算出待检测目标的世界坐标,实现空间定位,具体包括如下步骤:
S31:对所述单目摄像头进行标定,获得所述单目摄像头的内参矩阵,利用所述内参矩阵求解所述单目摄像头的旋转矩阵R和平移矩阵T;
S32:将获得的待测目标的图像坐标输入基于OpenCV的SolvePnP算法,利用所述旋转矩阵R和所述平移矩阵T解算出待检测目标的世界坐标,实现空间定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010386129.6/1.html,转载请声明来源钻瓜专利网。