[发明专利]基于流形稀疏编码的图像聚类的方法有效
申请号: | 201010522037.2 | 申请日: | 2010-10-28 |
公开(公告)号: | CN101986295A | 公开(公告)日: | 2011-03-16 |
发明(设计)人: | 王灿;卜佳俊;陈纯;郑淼;吴昊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N99/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 流形 稀疏 编码 图像 方法 | ||
1.基于流形稀疏编码的图像聚类的方法,包括以下步骤:
1)、获取待聚类的所有图像,将所有图像组成数据矩阵 ,,其中,是第i张图像的原始特征;获取每张图像中的SIFT特征,;其中为组成图像的第n个SIFT特征;
2)、构造一个数据字典B,,其中为向量维度与原始数据维度相同的基向量,利用数据矩阵X,学习数据字典B和图像的流形稀疏编码S,;其中,为采用流形稀疏编码表示的第i张图像特征;
3)、使用K-means聚类方法,采用欧式距离计算各个图像之间的距离,预设图像之间的距离阈值,将图像之间距离小于预设的距离阈值的图像聚为一类,使得图像最终按类别进行显示。
2.如权利要求1所述的基于流形稀疏编码的图像聚类的方法,其特征在于:步骤1)中,提取图像的SIFT特征的方法包括以下步骤:
(1.1)获取一张目标图像,进行尺度空间极值检测,即利用不同尺度的高斯差分方程同目标图像进行卷积,求取尺度空间极值;
(1.2)精确定位特征点的位置,即通过拟合三维二次函数以精确确定各特征点的位置和尺度(达到亚像素精度),同时去除低对比度的关键点和不稳定的边缘相应点、以增强匹配稳定性、提高抗噪声能力;
(1.3)确定特征点的主方向,即利用关键点领域像素的梯度方向分布特征为每个关键点指定方向参数,使算子具备旋转不变性;
(1.4)生成特征描述符,包括以下步骤:
(1.4.1)将坐标轴旋转为特征点的方向,以保证旋转不变性;
(1.4.2)以特征点为中心取16×16像素大小的窗口,但是特征点所在的行和列不取;
(1.4.3)在每个4×4的图像小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,形成一个种子点,每个特征点由4×4共16个种子点组成,每个种子点有8个方向向量信息,可产生4×4×8共128个数据,形成128维的SIFT特征向量,该SIFT特征向量为特征描述符。
3.如权利要求2所述的基于流形稀疏编码的图像聚类的方法,其特征在于:步骤2)中,利用数据矩阵X,通过求解目标函数 ,来学习数据字典B和图像的流形稀疏编码S,其方法包括以下步骤:
(2.1)初始化数据字典B,对数据字典B随机赋值,算法将从i=1开始通过步骤(2.2)及(2.3)逐个求解图像的流形稀疏编码以及更新后的数据字典B,直到i=m,迭代终止;
(2.2)将数据字典B作为已知信息,基于猜测图像的流形稀疏编码的符号,将原始目标函数中的项中的绝对值运算去除,从而使得原始含有绝对值的不可导的问题转换为一个简单的二次规划问题进行解决;
(2.3)将步骤(2.2)得出的图像的流形稀疏编码S作为已知信息,通过使用拉格朗日对偶法求解数据字典B,然后再次执行步骤(2.2)来求解下一个流形稀疏编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010522037.2/1.html,转载请声明来源钻瓜专利网。