[发明专利]数据过滤装置和方法,以及数据处理装置和方法有效
申请号: | 201210212664.5 | 申请日: | 2012-06-21 |
公开(公告)号: | CN103514195B | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 张明明;陆应亮;夏迎炬 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 过滤 装置 方法 以及 数据处理 | ||
技术领域
本发明涉及数据处理领域,尤其涉及一种数据过滤装置和方法,数据处理装置和方法,无线定位设备和方法,以及信息处理设备。
背景技术
在对海量数据进行数据挖掘、分析等过程中,经常需要对数据进行回归、聚类等传统处理操作,然而由于庞大的数据量,往往会导致数据处理效率低下。为了提高数据处理效率,特别是提高需要进行迭代的回归或聚类等的数据处理,高效、准确的数据过滤或约减技术变得尤其重要。
现有技术中,通常通过间隔采样的方法来对给定的数据集进行数据约减(过滤),或是首先对数据集进行聚类,然后,对各个数据块中的数据求平均值,用该平均值作为采样数据。上述数据过滤方法均没有考虑各个数据点自身的特性,使得一些对数据分析起关键作用的数据点在数据约减进程中丢失,而对数据分析贡献较小的数据得以保留,从而降低了诸如数据分析等数据处理的精度和/或准确度。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于现有技术的上述缺陷,本发明要解决的技术问题在于提供一种数据过滤装置和方法、数据处理装置和方法、无线定位设备和方法以及信息处理设备,以至少解决现有的数据过滤技术的处理精度和/或准确度低的问题。
为解决上述技术问题,根据本发明的一个方面,提供了一种数据过滤装置,该数据过滤装置包括:近邻集确定单元,其被配置用于确定待处理数据集中满足预定条件的数据子集中的每个数据的近邻集;计算单元,其被配置用于分别计算上述数据子集中的每个数据的近邻集中包含的数据量;以及过滤单元,其被配置用于基于上述数据子集中的每个数据的近邻集中包含的数据量,对上述数据子集中的数据进行过滤,以获得过滤后的数据集。
根据本发明的另一个方面,还提供了一种基于支持向量回归的数据处理装置,其中,上述数据处理装置包括如上所述的数据过滤装置,上述数据过滤装置被配置用于对训练阶段中所使用的训练数据预先进行过滤。
根据本发明的另一个方面,还提供了一种无线定位设备,该无线定位设备包括训练装置和定位装置,还包括如上所述的数据过滤装置,其中,上述数据过滤装置被配置用于对训练数据进行过滤,其中,上述训练数据包括多个位置以及与上述多个位置中的每一个相对应的RSS数据值;上述训练装置被配置用于利用经过上述数据过滤装置过滤的训练数据来训练支持向量回归模型;以及上述定位装置被配置用于基于与待定位对象相关的RSS数据值,以及利用经过上述训练装置训练的支持向量回归模型,来获得上述待定位对象的位置。
根据本发明的另一个方面,还提供了一种信息处理设备,该信息处理设备包括如上所述的数据过滤装置或如上所述的基于支持向量回归的数据处理装置或如上所述的无线定位设备。
根据本发明的又一个方面,还提供了一种数据过滤方法,该数据过滤方法包括:确定待处理数据集中满足预定条件的数据子集中的每个数据的近邻集;分别计算上述数据子集中的每个数据的近邻集中包含的数据量;以及基于上述数据子集中的每个数据的近邻集中包含的数据量,对上述数据子集中的数据进行过滤,以获得过滤后的数据集。
根据本发明的又一个方面,还提供了一种支持向量回归的数据处理方法,其中,该分类方法的训练阶段中包括如下步骤:利用如上所述的数据过滤方法对训练阶段中所使用的训练数据预先进行过滤。
根据本发明的又一个方面,还提供了一种无线定位方法,该无线定位方法包括:获得训练数据,其中,上述训练数据包括多个位置以及与上述多个位置中的每一个相对应的RSS数据值;对上述训练数据进行过滤;利用经过过滤的训练数据来训练支持向量回归模型;基于与待定位对象相关的RSS数据值,以及利用经过训练的支持向量回归模型,来获得上述待定位对象的位置;其中,上述的对上述训练数据进行过滤的步骤通过如上所述的数据过滤方法来实现。
根据本发明的又一个方面,还提供了一种存储有机器可读取的指令代码的程序产品,该程序产品在执行时能够使上述机器执行如上所述的数据过滤方法或如上所述的基于支持向量回归的数据处理方法或如上所述的无线定位方法。
依据本发明的其它方面,还提供了相应的计算机可读存储介质,该计算机可读存储介质上存储有如上所述的程序产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210212664.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗便秘膏药的配方
- 下一篇:酶辅助超声法提取蒙药瞿麦总皂苷的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置