[发明专利]一种连续模拟量时间序列数据挖掘方法在审
申请号: | 201610895695.3 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106446251A | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 缪孟良;彭侠夫;仲训昱 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 厦门南强之路专利事务所(普通合伙)35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种连续模拟量时间序列数据挖掘方法。1)数据清洗;2)确定周期划分;3)确定傅立叶变换的输出点数和抽样数据的抽样点数;4)周期内数据进行傅立叶变换;5)周期内数据抽样,每个周期与傅立叶变换相同的点数的抽样,作为代表时域的特征;6)把傅立叶变换输出数据和抽样数据存储为一个节点;7)计算整体平均节点密度;8)标记所有节点为未访问;9)随机选择一个未分类点Px并标已访问;10)若点Px的S邻域至少有m个点,则创建新簇Cn并把Px添加到簇Cn中;11)令N为Px的S邻域的节点集合;12)对每个N中的每个节点PNi进行操作;13)查看还有未访问节点吗,如有,则返回步骤9);14)输出簇C。 | ||
搜索关键词: | 一种 连续 模拟 时间 序列 数据 挖掘 方法 | ||
【主权项】:
一种连续模拟量时间序列数据挖掘方法,其特征在于包括以下步骤:1)数据清洗,发现并纠正数据文件中可识别的错误,包括检查数据一致性、处理无效值和缺失值等;2)确定周期划分;3)确定傅立叶变换的输出点数和抽样数据的抽样点数n;4)周期内数据进行傅立叶变换,设周期内数据为x,其中F(x)表示对x进行傅立叶变换,n表示抽样点数;5)周期内数据抽样,每个周期与傅立叶变换相同的点数的抽样,作为代表时域的特征;6)把傅立叶变换输出数据和抽样数据存储为一个节点;7)计算整体平均节点密度;8)标记所有节点为未访问;9)随机选择一个未分类点Px并标已访问;10)若点Px的S邻域至少有m个点,则创建一个新簇Cn并把Px添加到簇Cn中,其中S邻域表示距离点Px小于某个值的区域,m为S邻域中最少点的个数;11)令N为Px的S邻域的节点集合;12)对每个N中的每个节点PNi进行如下操作:若节点PNi为未访问,则标记为已访问;若节点PNi的S邻域至少有m个点,则把这些点添加到N中;若节点PNi还不是任何簇的成员,则把节点PNi添加到簇Cn中;把Cn添加到簇C中;13)查看还有未访问节点吗,如有,则返回步骤9);14)输出簇C。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610895695.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于云计算的个性化在线新闻评论情绪预测系统
- 下一篇:一种数据交换平台