[发明专利]一种实用于海量实时PMU数据的挖掘方法有效
申请号: | 201710865017.7 | 申请日: | 2017-09-22 |
公开(公告)号: | CN107679133B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 易建波;黄琦;井实;李坚;张真源;董彬彬;张国洲 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22 |
代理公司: | 51220 成都行之专利代理事务所(普通合伙) | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种实用于海量实时PMU数据的挖掘方法,先对数据量较小的PMU标识数据进行耗时的采样和挖掘表验证得到挖掘公式,随后对实时PMU数据流进行划分,通过轮转算法对各任务进行均衡分配,再结合挖掘公式采样挖掘,有运行时所占内存资源小,速度快,挖掘效果可随采样精度而提高的特点,对处理海量PMU数据具有良好的实时性和工程实用价值,同时本发明还解决了在PMU数据应用的相关领域因为数据规模庞大,多源,实时性强,分布式处理门槛高造成的数据接收与处理问题。 | ||
搜索关键词: | 挖掘 采样 实时性 分布式处理 数据流 标识数据 均衡分配 内存资源 数据规模 数据接收 数据量 运行时 轮转 多源 算法 耗时 验证 应用 | ||
【主权项】:
1.一种实用于海量实时PMU数据的挖掘方法,其特征在于,包括以下步骤:/n(1)、利用PMU标识数据生成数据挖掘表/n(1.1)、将PMU标识数据载入至内存并进行解析,再通过检索PMU标识数据中不同设备的文本信息,将解析后的PMU标识数据以单个设备为一层进行划分,再将划分后的数据层依次压入二维数组中,其中,二维数组每行数据即为单个设备采集的不同数据属性,其行索引作为该数据层的标识;/n(1.2)、在二维数组中,将用户需要设定或提取的数据属性在第一行中的位置进行记录,再将所有的记录位置组合成数据挖掘表;/n(2)、生成多组群数据/n在二维数组中,利用随机抽样的方法抽取N行连续的行数据,并标记为一组群数据;/n按照上述方法,随机抽取多次,得到多组群数据;/n(3)、校正数据挖掘表/n(3.1)、在多组群数据中随机抽取一组群数据,并作为采样群数据;/n(3.2)、在数据挖掘表中,找到最后一个数据属性在采样群数据中的位置索引T,其数据属性在数据挖掘表中的位置记录为t;/n(3.3)、验证T、t是否符合以下公式:/nT=t+N×m/n其中,N为采样群数据内包含的行数减一,m为行中数据属性的个数;/n若满足,则代表该组采样群数据中所有行数据的排列相同,适用于当前的数据挖掘表;/n若不满足,则将该组采样群数据分为两小群,在将两小群按照上述方法分别再次验证,直到找到不满足上述公式的行数据,记录行的标号,解析该行设定数据属性的位置,设定出新的数据挖掘表,再返回步骤(3.1);/n(3.4)、通过上述(3.1)~(3.3)的循环迭代后,直到最终设定的数据挖掘表在所有的采样群数据中不符合的行数最少时,迭代结束,并记录不满足最终设定的数据挖掘表所在行的索引及符合它们的挖掘表,再结合这些数据挖掘表,得到后续挖掘算法的挖掘公式;/nT'=t'+N'×m/nT'为数据属性在整个PMU标识数据中的位置索引,t'为数据属性在数据行对应的挖掘表中的位置记录,N'为挖掘过程中不断递增的行数,m为行中数据属性的个数;/n(4)、实时PMU数据的划分/n(4.1)、将环形内存缓冲区设置“空”、“未满”和“暂满”三个状态,其中,当环形内存缓冲区中无数据,则将其标记为“空”;当接收的实时PMU数据达到环形内存缓冲区大小上限时,本地文件系统自动创建一个溢出文件,并将环形内存缓冲区中的数据写入到该文件中,同时将环形内存缓冲区设为“暂满”;当环形内存缓冲区中有实时PMU数据但没有达到环形内存缓冲区大小上限时,则将环形内存缓冲区设置为“未满”;/n(4.2)、环形内存缓冲区接收实时PMU数据,并将接收的实时PMU数据流以n帧为一组不断载入到一个环形的内存缓冲区中,并在第一组数据末尾处设立起始标识位,并在整个实时挖掘过程中实时更新环形内存缓冲区的状态信息和起始标识位;/n(4.3)、利用轮转算法对接收的实时PMU数据进行多进程挖掘;/n(4.3.1)、利用轮转算法对多进程任务进行分配;/n(4.3.2)、判断环形内存缓冲区的状态信息;/n(4.3.3)、如果环形内存缓冲区的状态信息为“未满”,则不断取环形内存缓冲区中的起始标识位之前的行数据,并结合步骤(3.4)中挖掘公式进行挖掘,得到挖掘结果;/n(4.3.4)、如果环形内存缓冲区的状态信息为“暂满”,则将溢出文件载入到内存中,并结合步骤(3.4)中挖掘公式进行挖掘,得到挖掘结果;/n(4.3.5)、如果环形内存缓冲区的状态信息为“空”,则让任务挂起一段时间等待实时PMU数据载入环形内存中,再执行步骤(4.3.2);/n(5)、存储挖掘结果/n将步骤(4.3)得到的挖掘结果以数组的形式保存在内存中,当内存占用快满的时候,发出中断任务到任务队列中安排一个进程跳出挖掘循环,将挖掘过后的数据与挖掘表对应的数据变量关联存入磁盘。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710865017.7/,转载请声明来源钻瓜专利网。