[发明专利]利用分形计算针对偷盗燃气行为的数据挖掘方法有效
申请号: | 202110945879.7 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113407797B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 朱炼;王勇;唐滔滔 | 申请(专利权)人: | 成都千嘉科技有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/906 |
代理公司: | 北京市领专知识产权代理有限公司 11590 | 代理人: | 王莹莹 |
地址: | 610211 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 计算 针对 偷盗 燃气 行为 数据 挖掘 方法 | ||
1.一种利用分形计算针对偷盗燃气行为的数据挖掘方法,其特征在于:包括以下步骤:
步骤S1:提取若干燃气表具的数据,对所有数据进行预处理,形成待筛选的数据集S;所述数据集S中的每一个元素具有一只燃气表具的表号;
步骤S2:遍历数据集S中的每一个元素,按照表号分别对每个燃气表具的数据进行线性相关处理,计算其分形曲线;
所述按照表号分别对每个燃气表具的数据进行线性相关处理的步骤,包括:
对于每一只燃气表具,按照表号查询每天的最后一条读数,形成燃气表具的读数数据集R1;所述读数数据集R1中每个元素的数据格式为:[当前时间,读数,当日用气量];
去掉读数数据集R1中当日用气量为零的元素;
查询燃气表具的读数起始时间,使用该读数起始时间转换读数数据集R1的元素数据格式为:[当前时间和读数起始时间相差的天数,读数],形成读数数据集R2:
R2={[x1,y2],[x2,y2],...[xj,yj],...[xn,yn]};
其中xj表示j时刻和读数起始时间相差的天数,yj表示j时刻的读数;
根据读数数据集R2计算集合X和集合Y的线性相关系数ρ:
;
其中表示集合X={x1,x2,...xn}的平均数,表示集合Y={y1,y2,...yn}的平均数,表示集合X的标准差,表示集合Y的标准差;
所述计算其分形曲线的步骤,包括:
设定阈值t,将线性相关系数ρt的燃气表具从数据集S中剔除,以去除时间和燃气表具读数之间具有强相关性的数据;
对线性相关系数ρ≤t的燃气表具计算其分形维,设定一组时间间隔集合F={f|f,2f,3f,...kf,...mf},其中时间间隔为f,kf为第k个时间间隔的日期,使用时间间隔集合F中的每一个元素计算该燃气表具的用气曲线的长度v;
该燃气表具在任一个时间间隔的日期下,包含了n个直线段,则该时间间隔的时间尺度下的用气曲线长度v为:
;
其中,表示任一个时间间隔的天数,表示该时间间隔的前一个时间间隔的天数,表示任一个时间间隔当天的读数,表示该时间间隔的前一个时间间隔当天的读数;
将每一个时间间隔取对数f=ln(f),将每个时间间隔f对应的用气曲线长度v取对数v=ln(v),绘制f-v的分形曲线;
步骤S3:对分形曲线进行层次性聚类,得出的孤点为偷盗气行为的燃气表具。
2.根据权利要求1所述的一种利用分形计算针对偷盗燃气行为的数据挖掘方法,其特征在于:提取若干燃气表具的数据,对所有数据进行预处理的步骤,包括:
去除若干燃气表具的数据中有效数据不够和不稳定的数据,形成待筛选的数据集S。
3.根据权利要求2所述的一种利用分形计算针对偷盗燃气行为的数据挖掘方法,其特征在于:所述对分形曲线进行层次性聚类,得出的孤点为偷盗气行为的燃气表具的步骤,包括:
将每一只燃气表具的分形曲线定义为p,共有N只燃气表具,形成集合V={v1,v2,…,vN},对集合V进行数据标准化处理:
;
其中为集合V中的元素,max(v)为集合V中的最大值,min(v)为集合V中的最小值;
标准化处理后的所有燃气表具的分形曲线组成集合P={p};
对集合P进行层次性聚类,找出孤立点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都千嘉科技有限公司,未经成都千嘉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945879.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种橡胶密炼装置
- 下一篇:一种带有防护机构的金属焊接设备