[发明专利]一种水面全景图像目标检测识别方法有效
申请号: | 201710979114.9 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107844750B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 曹治国;杨健;肖阳;宫凯程;朱昂帆;赵晨 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 廖盈春;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 水面 全景 图像 目标 检测 识别 方法 | ||
本发明公开了一种水面全景图像目标检测识别方法,属于计算机视觉识别技术领域。本发明方法首先利用目标检测识别神经网络模型对全景图像进行目标检测识别,获取目标类别和检测框初始位置;之后对目标局部区域进行图像分割,得到多个超像素块,再采用多阈值融合策略合并所述超像素块,得到调整后目标检测框;再计算新的目标局部区域的边缘图,根据目标检测框box*周围边缘点的分布调整box*,得到最终目标检测框box*;最后由全景图像成像平面坐标系与世界坐标系的映射关系,将最终目标检测框box*位置转化为目标的实际位置。本发明方法能有效克服全景图像中畸变效应,从全景图像中将目标位置准确识别出来。
技术领域
本发明属于计算机视觉识别技术领域,更具体地,涉及一种水面全景图像目标检测识别方法。
背景技术
随着海洋强国战略的提出,我国已经开始大力发展海洋设备。无人艇作为一种无人水面移动平台,不仅能够进入一些恶劣环境中完成任务,同时也能够提高需要长时间作业的任务的完成效率,在许多实际应用中都发挥着十分重要的作用,例如海关巡逻、浅海扫雷和水质监测等等。对于无人艇而言,环境感知技术是其完成自主航行和自主避障不可缺少的一环。特别地,在实际作业的过程当中,仅能够检测前进方向的目标或障碍物是远远不够的,危险可能出现在无人艇周围任何的方位。因此,装备全景相机来采集无人艇周围360°范围内的环境信息,并实时检测其中的目标及障碍物,是提高无人艇自主航行安全性的有效手段。
在现有的技术中,尚没有将水面全景图像用于目标检测识别任务之中。有人曾提出一种基于三维全景环视的无人艇自动锚泊视觉辅助系统,在艇身周围布置多个相机和毫米波测距雷达,通过拼接多个相机的图像来合成全景图像辅助测距雷达进行自动锚泊,通过无人艇身上的多个相机采集图像信息实现广阔的视角监控。但是所述方法仅是利用全景图像辅助测距雷达进行自动锚泊,没有利用全景图像信息进行目标识别,目前常用的目标检测识别算法如下:
2014年,Ross Girshick等人发表了R-CNN算法,首次提出了基于目标潜在区域结合卷积神经网络的目标检测算法,代替了使用滑动窗口和手工设计特征的传统目标检测算法,使得目标检测的准确率得到了本质的提高。2015年,Kaiming He等人提出了Faster R-CNN算法,用一个卷积神经网络模型同时完成了分类任务与回归任务,实现了目标检测与识别;同时构建了RPN网络模型,大大缩减了算法运行时间。该算法取得了当时最好的效果,在VOC 2007数据集上正确率达到了73.2%。2015年,Wei Liu等人提出SSD算法,不同于R-CNN系列算法需要提取目标潜在区域,直接利用多层卷积特征生成目标检测框。由于不需要生成目标潜在区域,SSD算法的速度得到很大的提升。SSD300网络在VOC2007数据集上获得72.1%正确率的同时,计算速度达到了58fps。2016年,Jifeng Dai等人发表了R-FCN算法。R-FCN算法为了解决卷积神经网络池化层大量丢失图像空间信息的问题,提出了位置敏感型卷积滤波器,大大提高了目标检测识别正确率。
上述方法对当前公共数据库中的图像都有很好的效果,但是全景图像是由多个相机拍摄的照片变形拼接而形成,因而会存在拼接裂缝以及相机鱼眼模式产生的扭曲等畸变,这些畸变会导致目标产生较大的形变,上述基于深度学习的目标检测识别算法,能够克服目标一定程度的形变,但是无法解决目标大的形变,难以检测到目标准确位置,因此针对现有的全景图像,现有的基于深度学习的目标检测识别算法对目标位置识别准确率不够高。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了计算机视觉识别技术,其目的在于先利用基于深度学习的目标检测算法强大的拟合能力,找到初始目标检测框;之后针对全景图像畸变大的特点,分割目标局部区域产生若干超像素块,利用多阈值超像素块融合策略,调整初始目标检测框;接着根据目标检测框周围边缘点的分布情况,再次调整目标检测框位置,得到最终目标检测框;最后将最终目标检测框位置转化为目标的实际位置。由此解决现有技术中全景图像目标识别无法解决图像畸变影响的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710979114.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序