[发明专利]基于核函数匹配的空间金字塔物体识别方法有效
申请号: | 201511002911.9 | 申请日: | 2015-12-28 |
公开(公告)号: | CN105654122B | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 孔军;张迎午;蒋敏;高坤;柳晨华 | 申请(专利权)人: | 江南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/52 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 函数 匹配 空间 金字塔 物体 识别 方法 | ||
本发明专利公开了一种基于核函数匹配的空间金字塔物体识别方法。包含以下步骤:提取物体图像的ED‑SIFT(Efficient Dense Scale‑invariant Feature Transform)描述子;使用k‑means++聚类算法将训练样本的ED‑SIFT描述子聚类,获得视觉词典;引入空间金字塔,使用核函数匹配获得训练样本和测试样本的视觉单词直方图;使用SVM分类器完成训练样本的训练和测试样本的识别。本专利提出的算法对物体图像的识别具有较高的辨识度,并且在训练样本较少的情况下,采用简单的SVM分类器就可以获得良好的分类效果。
技术领域:
本发明涉及机器视觉领域,特别涉及一种基于核函数匹配的空间金字塔物体识别方法。
背景技术:
随着计算机和多媒体技术的飞速发展,数字图像和视频的规模急剧膨胀。海量的图像数据虽然方便了人们的生活,但是也给人们的生活带来了很大困扰。如何从海量的图像数据中快速准确的寻找我们自己感兴趣的物体图像,变得越来越困难。因此,如何充分准确的理解图像,如何有序、高效、合理的组织图像数据并检索到所需要的图像逐渐成为计算机视觉研究的热点之一。
近年来,以词袋模型(Bag of Words,BoW)为关键技术的物体识别算法取得的进步最为突出。近几十年来各国专家学者提出了很多方法,大大促进了该领域的进展。但是高精度的物体识别仍然是一项极具挑战的任务。原因之一就是物体的图像容易受到光线变化、视角变化、物体遮挡和背景等因素的影响。另外,同类物体间的差异进一步加剧了物体识别的难度。
本专利针对如何获得具有代表性的视觉单词和如何构建具有判别力的视觉单词直方图的问题,提出了一种基于核函数匹配的空间金字塔物体识别方法,大大提高了物体识别的准确率。
发明内容:
本发明为了克服上述现有技术中的缺陷和提高物体识别的准确率,提供了一种基于核函数匹配的空间金字塔物体识别方法。
为了实现上述目的,本发明提供如下技术方案:
步骤一、采集物体样本图像,将待识别的样本图像数据分为训练样本和测试样本;
步骤二、将训练样本和测试样本的图像转换为灰度图像,并将灰度图像的数据类型转化为双精度浮点类型。然后将图像的尺寸进行缩放处理,使其高度和宽度在[50,200]之间;
步骤三、提取训练样本和测试样本图像的ED-SIFT(Efficient Dense Scale-invariant Feature Transform)描述子;
步骤四、使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉单词。所有的视觉单词构成了视觉词典;
步骤五、引入空间金字塔[1],将训练样本的ED-SIFT描述子、测试样本的ED-SIFT描述子和视觉词典映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图;
步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练;
步骤七、基于训练后的SVM分类器,将测试样本的视觉单词直方图输入SVM分类器,完成物体的识别。
与现有的技术相比,本发明具有以下有益效果:
1.通过步骤三提取样本的ED-SIFT描述子的兴趣点多、信息量丰富、均匀采样提取关键点、计算复杂度低。能够有效提高视觉单词的代表性,提高识别的准确度。
2.通过步骤五引入空间金字塔,充分利用了图像的空间信息。将训练样本、测试样本和聚类的视觉单词映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图,大大提高了匹配精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511002911.9/2.html,转载请声明来源钻瓜专利网。