[发明专利]一种高维图像数据降维的二值编码方法及系统在审
申请号: | 201711498106.9 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108228823A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 李明强;张德;刘光宏;陈思;张峰;高放 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06T9/00;G06F17/16 |
代理公司: | 北京中知法苑知识产权代理事务所(普通合伙) 11226 | 代理人: | 常玉明;张兰海 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 降维 二值编码 图像数据 高维 向量 图像数据存储 编码系统 高维数据 加速图像 模式识别 数据检索 数据信息 维度空间 向量表示 原数据 | ||
本发明公开的高维图像数据降维的二值编码方法及编码系统,可以实现高维数据在任意维度空间上的向量表示,并且向量维0‑1二值向量,能够减少图像数据存储的要求以及加速图像数据检索、模式识别等领域的效率,且降维之后的数据信息与原数据信息极小,因此具有很高的实用价值。
技术领域
本发明属于计算机视觉领域,具体为高维图像数据处理领域。
背景技术
图像是客观对象的一种相似性、生动性的描述或写真,是人类社会生活中最常用的信息载体。或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。它是人们最主要的信息源。据统计,一个人获取的信息大约有75%来自视觉。随着成像技术的发展,人们能够获得的图像分辨率越来越高,同时随着互联网络技术的发展,数据结构更加多样化,呈现爆炸性增长的图像数据正在充斥整个网络,海量高维度的图像数据一方面使人难以理解数据之间的关系,另一方面使得图像的存储、传输、检索变得更加困难。
作为一类普遍存在的规律,在大多数情况下我们观察到的图像信息,表面上看是高维的、复杂的,实际上可以用很少简答的变量来支配。在原始的高维空间中,包含有冗余信息以及噪音信息,在实际应用例如图像识别中造成了误差,降低了准确率。图像数据意义在于有效信息的提取综合及无用信息的摈弃。在很多情形下,将高维图像数据映射到一个合理的大小的低维度空间,并且低维数据用二值数据来表示,然后将低维二值数据送入到处理系统中,不仅仅可以降低计算机内存的需求,而且可以提高数据的处理效率,因此一种高维图像数据的二值化降维编码方法在图像检索、模式识别等领域具有非常重要的价值。
目前来说,图像数据的降维方法主要有两类:
(1)通过输入图像数据的二阶统计特性来发现数据的线性结构,其基本思想是最小二乘的准则下寻找最优线性投影的线性模型,保留数据中方差较大的方向,丢弃数据张方差较小的方向,减少有效数据表示所需要的特征维数;
(2)对高维图像数据集中的每个数据点,通过k邻近算法构建高维图像数据的带权领域图,计算领域图中任意数据对之间的最短路径,然后利用多维尺度变换算法对原数据集进行降维。
第一类方法算法简单,具有线性误差等优点,但存储空间大,计算复杂度高。第二类方法具有拓扑不稳定姓,容易受到噪声的影响。综合来说,现有的方法计算复杂度高,并且得到的降维数据为实值数据,非常不利于数据检索。
发明内容
因此本发明旨在提出一种新的高维图像数据降维方法及系统,主要解决的如下的问题:
(1)该方法可以实现任意维度的数据降维;
(2)降维之后的数据信息与原数据信息偏差不大;
(3)降维之后的数据信息为二值化数据。
本发明具体方案如下:
一种高维图像数据降维的二值编码方法,所述方法包括如下步骤:
1)邻域选取,对训练集中的每一副图像l中的每一个像素点Iij,取其8个邻域即:
2)差分特征构造,以Iij为中心,对其8个邻域进行旋转得到8维差分特征向量x,向量x中的每一个元素为8个邻域元素与中心元素的差;以图像为单位,将像素的差分特征拉成一个向量,维度为d维;
3)主成分分析降维,对差分矩阵进行降维计算,获得降维特征矩阵;
4)最优旋转,对降维特征进行最优旋转,并用阈值进行二值化。
其中,步骤2)差分特征构造具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711498106.9/2.html,转载请声明来源钻瓜专利网。