[发明专利]一种高维数据模式分类方法及装置在审
申请号: | 201610059218.3 | 申请日: | 2016-01-28 |
公开(公告)号: | CN105740896A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 李利伟;张兵;厉为;高连如;高建威 | 申请(专利权)人: | 中国科学院遥感与数字地球研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 模式 分类 方法 装置 | ||
技术领域
本申请涉及模式分类技术领域,更具体地说,涉及一种高维数据模式分类方法及装置。
背景技术
现代生活逐渐进入物联网时代,各种不同类别和功能的实体目标通过数字化描述和网络通信实现相互联系,极大提高了生活质量和生产效率。传感器技术依据电磁波等介质与目标作用原理,能够经济便捷地采集实体目标的多种属性数据,有力支撑了人们对实体目标数字化管理和科学认知。
伴随着传感器类型及其应用程度的不断增加,人们能够获取的目标属性数据的种类和数量不断增大,通过挖掘蕴含在大量数据中的不同类别的模式信息,为日常生活和科研活动带来了更多可能。
然而,实际应用中关于目标的属性数据通常包含数个乃至百千个维度,具有很强的复杂性,给模式分类在计算精度上带来了很大困难。高维数据模式分类在实际应用中的难点主要体现在:数据所在的特征空间统计分布十分复杂,传统算法对高维数据模式分类的计算精度很低。
发明内容
有鉴于此,本申请提供了一种高维数据模式分类方法及装置,用于解决现有高维数据模式分类计算精度低的问题。
为了实现上述目的,现提出的方案如下:
一种高维数据模式分类方法,包括:
读取待分类的高维数据,所述高维数据为由行、列和层组成的三维数组R,其中,任意行和列组合对应位置处的数据集合作为一个目标,目标为Bands维列向量,Bands为三维数组R的层数;
读取标记有分类类别的训练样本集S;所述训练样本集S包含N个类别的训练样本子集,每个类别的训练样本子集为一个Bands维列数组,列数组中的每一行记录该类别的一个训练样本;
按照预置类别投票规则对每一个目标与所述训练样本集S中的每一个训练样本进行模式匹配,确定各类别的投票结果;
根据所述各类别的投票结果,将类别投票得分最高的类别确定为目标所属的类别。
优选地,所述按照预置类别投票规则对每一个目标与所述训练样本集S中的每一个训练样本进行模式匹配,确定各类别的投票结果,包括:
计算目标中的每一个元素,与训练样本集S中的各训练样本中对应元素的距离,并确定距离最小的训练样本,为该训练样本对应的类别记一票;
依据目标中所有元素的类别投票结果,统计N个类别的得票个数。
优选地,所述按照预置类别投票规则对每一个目标与所述训练样本集S中的每一个训练样本进行模式匹配,确定各类别的投票结果,包括:
根据预置多层次特征集合构建策略,对所述目标进行多层次特征集合构建,得到目标的Bands层的目标特征集合,其中第i层的目标特征集合包含C(Bands,i)个元素;
根据所述预置多层次特征集合构建策略,对所述训练样本集S中的每个训练样本进行多层次特征集合构建,得到每个训练样本的Bands层的训练样本特征集合,其中第i层的训练样本特征集合包含C(Bands,i)个元素;
依次计算目标的每一层的目标特征集合中的每一个元素,与各个训练样本的对应层的训练样本特征集合中的对应元素的距离,并确定距离最小的训练样本,为该训练样本对应的类别记一票;
依据同层的目标特征集合中的所有元素的类别投票结果,统计N个类别的得票个数,得到该层表征N个类别各自得票个数的类别特征列向量;
将所述类别特征列向量除以该层的目标特征集合的元素个数,得到归一化后的类别特征列向量;
按照设定的各层权重值,将所有层的归一化后的类别特征列向量进行加权相加,得到总的类别特征列向量;
则,所述根据所述各类别的投票结果,将类别投票得分最高的类别确定为目标所属的类别,包括:
在所述总的类别特征列向量中选取值最大的类别,作为目标所属的类别。
优选地,所述依次计算目标的每一层的目标特征集合中的每一个元素,与各个训练样本的对应层的训练样本特征集合中的对应元素的距离,包括:
依次计算目标的每一层的目标特征集合中的每一个元素,与各个训练样本的对应层的训练样本特征集合中的对应元素的欧氏距离。
优选地,所述根据预置多层次特征集合构建策略,对所述目标进行多层次特征集合构建,得到目标的Bands层的目标特征集合,包括:
将目标自身确定为第1层的目标特征集合;
对所述第1层的目标特征集合中任意i个元素进行组合,得到i维特征向量集合,将该i维特征向量集合确定为目标的第i层的目标特征集合,其中i为从2至Bands的整数。
一种高维数据模式分类装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院遥感与数字地球研究所,未经中国科学院遥感与数字地球研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610059218.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车气制动阀总成
- 下一篇:清洗喷漆喷雾头的雾状清洗剂废剂回收装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置