[发明专利]数据分析方法及装置在审
申请号: | 201710709590.9 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107506424A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 刘志欣;张皓;黄旭;苏保强;魏加项;陈春燕 | 申请(专利权)人: | 国网北京市电力公司;国家电网公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q50/06 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 赵囡囡 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 方法 装置 | ||
1.一种数据分析方法,其特征在于,包括:
确定历史关键词频数据库,其中,所述历史关键词频数据库中包括:关键词,关键词出现的频次,其中,所述关键词为电力系统的业务信息文本中出现频次超过预定次数的词语;
对所述历史关键词频数据库进行更新,将更新后的历史关键词频数据库作为当前关键词频数据库;
将所述历史关键词频数据库与所述当前关键词频数据库进行比对,获取比对结果;
基于所述比对结果对当前业务数据进行分析,其中,所述当前业务数据是当前时间段内的电力系统的业务信息文本对应的数据。
2.根据权利要求1所述的方法,其特征在于,确定所述历史关键词频数据库包括:
获取预定历史时间段内的预定数量的电力系统的业务信息文本;
对所述预定数量的电力系统的业务信息文本中的每个电力系统的业务信息文本进行分词,得到分词集合,其中,所述分词集合中包括多个关键词;
基于所述分词集合构成所述历史关键词频数据库。
3.根据权利要求1所述的方法,其特征在于,对所述历史关键词频数据库进行更新包括:
对当前时间段内的电力系统的业务信息文本进行分词,获取当前关键词集合;
分别统计所述当前关键词集合中各个关键词出现的频次,获取统计结果;
基于所述统计结果对所述历史关键词频数据库进行更新。
4.根据权利要求1所述的方法,其特征在于,将所述历史关键词频数据库与所述当前关键词频数据库进行比对,获取所述比对结果包括:
采集所述历史关键词频数据库中各个关键词出现的频次,获取采集结果;
基于所述采集结果生成第一曲线图,其中,所述第一曲线图中包括:所述历史关键词频数据库中各个关键词以及各个关键词出现的频次;
监控所述当前关键词频数据库中各个关键词出现的频次,获取监控结果;
基于所述监控结果生成第二曲线图,其中,所述第二曲线图中包括:所述当前关键词频数据库中各个关键词以及各个关键词出现的频次;
将所述第一曲线图与所述第二曲线图进行比对,获取所述比对结果。
5.根据权利要求4所述的方法,其特征在于,基于所述比对结果对所述当前业务数据进行分析包括:
基于所述第一曲线图与所述第二曲线图生成第三曲线图,并将所述第三曲线图作为所述比对结果,其中,所述第三曲线图中包括:所述历史关键词频数据库中各个关键词出现的频次与所述当前关键词频数据库中各个关键词出现的频次的差值;
判断所述第三曲线图中所述历史关键词频数据库中各个关键词出现的频次与所述当前关键词频数据库中各个关键词出现的频次的差值是否超过预定数值;
若超过,触发提示指令,所述提示指令用于指示对所述当前业务数据进行分析。
6.一种数据分析装置,其特征在于,包括:
确定单元,用于确定历史关键词频数据库,其中,所述历史关键词频数据库中包括:关键词,关键词出现的频次,其中,所述关键词为电力系统的业务信息文本中出现频次超过预定次数的词语;
更新单元,用于对所述历史关键词频数据库进行更新,将更新后的历史关键词频数据库作为当前关键词频数据库;
比对单元,用于将所述历史关键词频数据库与所述当前关键词频数据库进行比对,获取比对结果;
分析单元,用于基于所述比对结果对当前业务数据进行分析,其中,所述当前业务数据是当前时间段内的电力系统的业务信息文本对应的数据。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:
获取模块,用于获取预定历史时间段内的预定数量的电力系统的业务信息文本;
第一分词模块,用于对所述预定数量的电力系统的业务信息文本中的每个电力系统的业务信息文本进行分词,得到分词集合,其中,所述分词集合中包括多个关键词;
构建模块,用于基于所述分词集合构成所述历史关键词频数据库。
8.根据权利要求6所述的装置,其特征在于,所述更新单元包括:
第二分词模块,用于对当前时间段内的电力系统的业务信息文本进行分词,获取当前关键词集合;
统计模块,用于分别统计所述当前关键词集合中各个关键词出现的频次,获取统计结果;
更新模块,用于基于所述统计结果对所述历史关键词频数据库进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网北京市电力公司;国家电网公司,未经国网北京市电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710709590.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:照片选购方法、装置及存储介质
- 下一篇:一种网页文件采集归档方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置