[发明专利]基于深度学习的全景图像对象检测方法在审
申请号: | 201810991838.X | 申请日: | 2018-08-29 |
公开(公告)号: | CN109255375A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 焦健;连海东;李哲;张立华 | 申请(专利权)人: | 长春博立电子科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G16H50/20 |
代理公司: | 长春市吉利专利事务所 22206 | 代理人: | 李晓莉 |
地址: | 130000 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选区域 对象检测 全景图像 图像 输入测试 搜索算法 特征输入 输出 固定的 缩放 运算 学习 分类 | ||
本发明提供一种基于深度学习的全景图像对象检测方法,所述方法包括:S1输入测试图像;S2利用选择搜索算法在图像中提取2000个左右的候选区域;S3将每个候选区域缩放成固定的特征并传入CNN,经过运算输出CNN特征(warp)成227×227的大小并输入到CNN,将CNN的fc7层的输出作为特征;S4将每个候选区域提取到的CNN特征输入到SVM分类器进行分类。
技术领域
本发明涉及中医诊疗辅助信息技术领域,具体涉及一种基于深度学习的全景图像对象检测方法
背景技术
目标检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现在图像中哪个区域图像中的目标可能出现在任何位置,目标的形态可能存在各种各样的变化,图像的背景千差万别……,这些因素导致目标检测并不是一个容易解决的任务得益于深度学习,主要是卷积神经网络 (convolution neural network:CNN)和候选区域(region proposal)算法,从2014年开始,目标检测取得了巨大的突破
传统目标检测方法:
传统目标检测方法一般使用滑动窗口的框架,主要包括以下三个步骤:
(1)利用不同尺寸的滑动窗口,框住图像的某一部分,将其作为候选区域;
(2)提取候选区域相关的视觉特征,比如人脸检测常用的Harr特征、行人检测和普通目标检测常用的HOG特征等;
(3)利用分类器进行识别,比如常用的SVM模型
但是传统目标检测主要存在两个问题:一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性
基于深度学习的目标检测:
深度学习的概念由Hinton等人于2006年提出,深度学习源于大脑认知原理的研究,是一种能够模拟出人脑的神经结构的机器学习方式,从而能够让计算机拥有人工智能,大家所熟知的AlphaGo就是深度学习典型的一个应用深度学习的许多研究成果,离不开对大脑认知原理的研究,尤其是视觉原理的研究人类识别气球的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)
下面是人脑进行人脸识别的一个示例
在最底层特征基本上是类似的,就是各种边缘,越往上,越能提取出此类物体的一些特征(如眼睛、躯干等),到最上层,不同的高级特征最终组合成相应的图像,从而能够让人类准确地区分不同的物体那么我们可以很自然地想到:可以不可以模仿人类大脑的这个特点,构建多层的人工神经网络,来达到这样一个目的呢?答案当然是肯定的,这也是许多深度学习算法(包括CNN)的灵感来源
所以,基于深度学习的目标检测便应运而生,主流的检测方式有两种,第一种就是候选区域(Region Proposal)候选区域利用图像中的纹理、边缘、颜色等信息,预先找出图中目标可能出现的位置,可以保证在选取较少窗口(几千个甚至几百个)的情况下保持较高的召回率这大大降低了后续操作的时间复杂度,并且获取的候选窗口要比传统目标检测采用的滑动窗口的质量更高
有了候选区域,剩下的工作实际就是对候选区域进行图像分类了(特征提取 +分类)对于图像分类,首先诞生的就是R-CNN(基于区域的卷积神经网络),R- CNN是第一个真正可以实现工业级应用的解决方案,它的诞生,使得目标检测的准确率大幅提升,基于深度学习的目标检测就渐渐成为了科研和工业领域的主流
基于深度学习的目标检测的实现过程如下:
(1)输入测试图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春博立电子科技有限公司,未经长春博立电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810991838.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序