[发明专利]利用分形计算针对偷盗燃气行为的数据挖掘方法有效
申请号: | 202110945879.7 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113407797B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 朱炼;王勇;唐滔滔 | 申请(专利权)人: | 成都千嘉科技有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/906 |
代理公司: | 北京市领专知识产权代理有限公司 11590 | 代理人: | 王莹莹 |
地址: | 610211 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 计算 针对 偷盗 燃气 行为 数据 挖掘 方法 | ||
本发明公开了一种利用分形计算针对偷盗燃气行为的数据挖掘方法,包括步骤:提取若干燃气表具的数据,对所有数据进行预处理,形成待筛选的数据集S;所述数据集S中的每一个元素具有一只燃气表具的表号;遍历数据集S中的每一个元素,按照表号分别对每个燃气表具的数据进行线性相关处理,计算其分形曲线;对分形曲线进行层次性聚类,得出的孤点为偷盗气行为的燃气表具。本发明基于分形维的偷盗燃气监控原理是以时段作为度量的尺子,考察用气量K线的分形曲线,在此基础上,通过基于欧几里得距离的层次性聚类的方式,定位出分形特征比较特别的燃气用户,从而挖掘出偷盗气用户。
技术领域
本发明涉及燃气数据处理技术领域,特别涉及一种利用分形计算针对偷盗燃气行为的数据挖掘方法。
背景技术
燃气的广泛使用给社会生产、人民生活带来了极大的便利,于此同时,各类偷盗气现象层出不穷,不仅给燃气公司造成了巨大的经济损失,也给社会安全埋下了隐患。由于偷盗气行为的隐蔽性和偷盗气方式的不断变化,传统依靠巡检、稽查等方法已经很难及时高效的进行排查。比如在北方的采暖季节时,燃气使用量大,由偷盗行为造成的经济损失是以千万计的。因此,如何利用燃气表具已有的历史数据,分析挖掘出偷盗气的行为,能够给社会建设提供很大的帮助。
发明内容
本发明的目的在于利用燃气表具已有的历史数据,基于分形维分析挖掘出偷盗气行为,提供一种利用分形计算针对偷盗燃气行为的数据挖掘方法。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
一种利用分形计算针对偷盗燃气行为的数据挖掘方法,其特征在于:包括以下步骤:
步骤S1:提取若干燃气表具的数据,对所有数据进行预处理,形成待筛选的数据集S;所述数据集S中的每一个元素具有一只燃气表具的表号;
步骤S2:遍历数据集S中的每一个元素,按照表号分别对每个燃气表具的数据进行线性相关处理,计算其分形曲线;
步骤S3:对分形曲线进行层次性聚类,得出的孤点为偷盗气行为的燃气表具。
提取若干燃气表具的数据,对所有数据进行预处理的步骤,包括:
去除若干燃气表具的数据中有效数据不够和不稳定的数据,形成待筛选的数据集S。
所述按照表号分别对每个燃气表具的数据进行线性相关处理的步骤,包括:
对于每一只燃气表具,按照表号查询每天的最后一条读数,形成燃气表具的读数数据集R1;所述读数数据集R1中每个元素的数据格式为:[当前时间,读数,当日用气量];
去掉读数数据集R1中当日用气量为零的元素;
查询燃气表具的读数起始时间,使用该读数起始时间转换读数数据集R1的元素数据格式为:[当前时间和读数起始时间相差的天数,读数],形成读数数据集R2:
R2={[x1,y2],[x2,y2],...[xj,yj],...[xn,yn]};
其中xj表示j时刻和读数起始时间相差的天数,yj表示j时刻的读数;
根据读数数据集R2计算集合X和集合Y的线性相关系数ρ:
;
其中表示集合X={x1,x2,...xn}的平均数,表示集合Y={y1,y2,...yn}的平均数,表示集合X的标准差,表示集合Y的标准差。
所述计算其分形曲线的步骤,包括:
设定阈值t,将线性相关系数ρt的燃气表具从数据集S中剔除,以去除时间和燃气表具读数之间具有强相关性的数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都千嘉科技有限公司,未经成都千嘉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945879.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种橡胶密炼装置
- 下一篇:一种带有防护机构的金属焊接设备