[发明专利]一种基于优化卷积架构的图像目标识别方法在审
申请号: | 201410767043.2 | 申请日: | 2014-12-12 |
公开(公告)号: | CN104517122A | 公开(公告)日: | 2015-04-15 |
发明(设计)人: | 王雪姣;王梁昊;李东晓;张明 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/02 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优化 卷积 架构 图像 目标 识别 方法 | ||
技术领域
本发明属于图像分析识别技术领域,具体涉及一种基于优化卷积架构的图像目标识别方法。
背景技术
目前,模式识别作为机器学习中的热门研究领域,随着计算机网络图像数据的海量出现越来越受到重视。为了有效管理图像数据并更好的为用户服务,图像目标的自动识别变得尤为重要。
传统的图形识别方法如SVM(Support Vector Machine,支持向量机)、Boosting主要是通过提取图像的特征再进行分类识别。卷积神经网络则是一种基于监督的深度学习模型,实质是模拟人脑机制构建具有多隐层的学习网络,其“感受野”和权值共享的网络结构降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。以图像直接作为网络输入,卷积神经网络通过逐层特征变换来学习更抽象的特征表达以达到分类识别的目的。
Yann LeCun提出卷积神经网络是一种基于监督的深度学习模型,实质是模拟人脑机制构建具有多隐层的学习网络,其“感受野”和权值共享的网络结构降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。具体而言,卷积神经网络包括卷积层、采样层、全连接层和输出层。其中,卷积层以图像直接作为网络输入,通过与不同的卷积滤波器卷积得到多个特征图。特征图经降采样操作降低维数并通过激活函数得到采样层。采样层输出直接作为下一卷积层的输入,这一卷积、采样操作可重复多次。全连接层以最高卷积层的特征为输入并映射为向量输出。输出层则是一个C-类的softmax分类器。
卷积神经网络应用于手写数字开始,基于卷积神经网络的图像分类技术已经应用于车型、人脸等识别任务上,并在训练收敛速度和识别率取得了较好的效果。尽管如此,目前卷积神经网络在模式识别中的应用还存在以下缺陷:
第一,尽管当前图像数据海量,但由于基于监督的学习方式其训练数据需要带标签,使当前卷积神经网络应用的分类对象较少且受限于训练库。
第二,在对较多图像类别进行识别时,卷积神经网络规模相应增大,其待训练参数大幅增长,容易出现过拟合现象。
第三,卷积神经网络对新的对象识别任务的可移植性不强,即在面对未知复杂的图像识别对象时,训练收敛速度和目标识别率上很难以让用户满意。
发明内容
针对现有技术所存在的上述技术问题,本发明提供了一种基于优化卷积架构的图像目标识别方法,能够扩充带标签样本,支持较多对象分类并获得较快的训练收敛速度和较高的图像目标识别率。
一种基于优化卷积架构的图像目标识别方法,包括如下步骤:
(1)对输入的样本图像进行图像增强处理;
(2)利用处理后得到的样本图像对卷积神经网络进行优化训练;
(3)输入目标图像至训练好的卷积神经网络中,以对该目标图像进行分类识别。
所述的样本图像来自目前图像识别领域最大且语义学上分类最全的训练库ImageNet。
所述的步骤(1)中对样本图像进行图像增强处理的具体过程如下:
1.1图像平移和翻转:在样本图像四周和中心分别提取固定大小的图像块并做水平翻转,以得到扩增10倍的图像训练集;
1.2图像的RGB颜色通道强度变更:对于每一样本图像,在对图像RGB像素值做PCA处理后,通过以下算式将像素各通道主成份倍乘对应标准高斯随机量化的特征值,将结果添加到原始的RGB通道分量上,以改变像素的颜色强度:
Ixy=[Rxy,Gxy,Bxy]T+[PR,PG,PB][αRλR,αGλG,αBλB]T
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;,未经浙江大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410767043.2/2.html,转载请声明来源钻瓜专利网。