[发明专利]基于物联网的数据挖掘方法在审
申请号: | 201510283038.9 | 申请日: | 2015-05-28 |
公开(公告)号: | CN104866587A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | 王美婷 | 申请(专利权)人: | 成都艺辰德迅科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 杨春 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 联网 数据 挖掘 方法 | ||
技术领域
本发明涉及物联网,特别涉及一种基于物联网的数据挖掘方法。
背景技术
物联网实现了用户对信息的传感、收集与感知。但利用物联网进行信息交换与通信的过程中会产生海量的数据如射频数据、传感器数据等,这些数据不断的增多加大了用户从中获取有用信息的难度。为了提高物联网的数据处理功能,现有技术结合应用云计算、大数据技术,构建百万计算机集群的云模式,以分布式计算技术与存储机制,增强物联网的计算功能。然而,现有的物联网在面对海量业务数据方面仍然不够快速地进行分析、处理、存储、挖掘,从而无法实现有价值信息的快速提取,物联网商业决策因此尚未得到最快的服务。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种基于物联网的数据挖掘方法,包括:
一种基于物联网的数据挖掘方法,用于处理物联网中的射频标签数据进行分类,其特征在于,包括:
在数据预处理过程中将样本属性量化为数值类型,通过属性类对训练样本进行K-means聚类,在不同类别的子集之间进行类间调整;根据落入不同分类区域的样本,采用相应的处理过程来分类样本。
优选地,所述在不同类别的子集之间进行类间调整,进一步包括:
若聚类后的子集存在空间重叠,则:
Step1设一个集合
Step2对于任意两个不属于同一类的子集A和B,若存在实例集{x1,x2,...,xn}属于子集A,且每一个实例X有|X,A|>|X,B|,其中|X,A|表示实例X到子集A的马氏距离,其中n是子集的实例数,或者存在实例集{x1,x2,...,xn}属于B,且实例集中{x1,x2,...,xn}的每一个实例X有|X,A|<|X,B|,若实例集{x1,x2,...,xn}的实例数大于设置的参数阈值β,则将A和B集合加入集合U;
Step3如果算法结束;否则转Step4;
Step4将U集合中的子集按属性类分别聚类为2个子集,若已分类实例集{x1,x2,...,xn},则保留两个新子集,置集合U为空,转至Step2,若没有分类,跳转至step4。
Step5若类域空间中的子集所有样本的{x1,x2,...,xn}都相同,则将该子集空间称为稳定区域;若子集所有样本的{x1,x2,...,xn}属于不同的类别,则将该子集的空间确定为临界区域,将样本空间中,除了稳定区域和临界区域剩下的所有空间,称为增量处理区域;
对于临界区域,统计落入各个临界区域内每一个类别的实例数,用其中最大样本实例数的类别代表该临界区域的类别;对于稳定区域直接分类给该稳定子集所代表的类域;对于增量处理区域,利用增量处理过程来分类样本。
优选地,所述对于增量处理区域,利用增量处理方法来分类样本,进一步包括:
步骤1:对于落入增量处理区域的样本集合S,若不是首次处理,跳转至步骤2,若是第一次处理,则将集合S按照属性类,使用欧式距离作为度量方式,求出中心向量集合P,对集合S分类,生成错误分类集合α,随机地以集合α中的实例x为新增加的中心向量,再次分类集合S,若新增加的中心向量的适应度Γ>0,则实例x为新的中心向量,加入集合P,从集合S中去除正确分类的所有实例,重复该步骤,直到查找所有的新增中心向量;
步骤2:判断落入增量处理区域空间的实例总数SUM是否达到预设的样本总数阈值Φ,若达到,落入增量处理区域的实例总数SUM=0,对代表样本集合J分类,重新进行区域划分,若没有达到阈值Φ,重新计算落入增量处理区域的实例总数SUM,在已有的中心向量集合P基础上,分类集合L,得到错误分类集合π,将代表样本集合加入新训练集合,随机地以集合π中的实例x作为新增加的中心向量,再次分类新训练样本,若实例x的中心向量适应度Γ>0,则实例x作为新的中心向量加入集合P,直到查找所有的新增中心向量;
步骤3,重新从落入增量处理区域的样本,选取代表样本,最后保留代表样本。
本发明相比现有技术,具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都艺辰德迅科技有限公司,未经成都艺辰德迅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510283038.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索引擎中摘要的展现方法和装置
- 下一篇:显示页面信息的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置