[发明专利]一种信访数据挖掘评分方法及系统有效
申请号: | 201610585288.2 | 申请日: | 2016-07-25 |
公开(公告)号: | CN106294542B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 张宗林 | 申请(专利权)人: | 北京市信访矛盾分析研究中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100005 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信访 数据 挖掘 评分 方法 系统 | ||
1.一种信访数据挖掘评分的方法,其特征在于,包括以下步骤:
步骤1:从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;
步骤2:对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;
步骤3:根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准;
所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访数据;
所述步骤1中从大数据库中抽取信访数据的过程包括:在大数据库中当有数据发生变化时,通过时间戳条件或者更新日志的方式从大数据库中提取发生变化的数据,得到的数据为符合条件的信访数据;
所述步骤1对信访数据的处理包括数据清理和数据变换;所述数据清理将抽取的信访数据清理获得无重复的标准信访数据;所述数据变换将标准信访数据从事务性数据转换成适合数据挖掘的挖掘数据;
所述数据清理包括去重、标准化数据项和去噪操作,所述去重将信访数据中重复录入的数据去除;所述标准化数据项将不同形式录入的信访数据按照统一标准排序记录,使处理后的数据更易统计;所述去噪将信访数据中的噪声数据去除;
所述数据变换的过程包括平滑聚集、数据概化、规范化、概念分层和离散化操作;
所述步骤2中的关键词包括过激次数、信访人数、信访次数、信访途径数和信访耗时;
所述步骤3中不同关键词根据各自对应的权重值获得与整体评分的百分比,将所有关键词对应的百分比按从大到小排序后建立综合评分标准;其中所述权重值越大所占百分比越大。
2.一种信访数据挖掘评分的系统,其特征在于,包括:抽取模块,从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;挖掘模块,对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;标准建立模块,根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准;
所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访数据;
所述抽取模块中从大数据库中抽取信访数据的过程包括:
在大数据库中当有数据发生变化时,通过时间戳条件或者更新日志的方式从大数据库中提取发生变化的数据,得到的数据为符合条件的信访数据;
所述抽取模块对信访数据的处理包括数据清理和数据变换;所述数据清理将抽取的信访数据清理获得无重复的标准信访数据;所述数据变换将标准信访数据从事务性数据转换成适合数据挖掘的挖掘数据;
所述数据清理包括去重、标准化数据项和去噪操作,所述去重将信访数据中重复录入的数据去除;所述标准化数据项将不同形式录入的信访数据按照统一标准排序记录,使处理后的数据更易统计;所述去噪将信访数据中的噪声数据去除;
所述数据变换的过程包括平滑聚集、数据概化、规范化、概念分层和离散化操作;
所述挖掘模块中的关键词包括过激次数、信访人数、信访次数、信访途径数和信访耗时;
所述标准建立模块中不同关键词根据各自对应的权重值获得与整体评分的百分比,将所有关键词对应的百分比按从大到小排序后建立综合评分标准;其中所述权重值越大所占百分比越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市信访矛盾分析研究中心,未经北京市信访矛盾分析研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610585288.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通讯信息收集方法和装置
- 下一篇:一种组合摄像机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置