[发明专利]一种信访数据挖掘评分方法及系统有效
申请号: | 201610585288.2 | 申请日: | 2016-07-25 |
公开(公告)号: | CN106294542B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 张宗林 | 申请(专利权)人: | 北京市信访矛盾分析研究中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100005 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信访 数据 挖掘 评分 方法 系统 | ||
技术领域
本发明涉及一种信访数据挖掘评分的方法及系统,属于计算机技术领域。
背景技术
信访,是指公民、法人或者其它组织采用书信、电子邮件、传真、电话、走访等形式,向各级人民政府、县级以上人民政府工作部门反映情况,提出建议、意见或者投诉请求,依法由有关行政机关处理的活动。
信访是除法律以外的又一种解决问题的办法,是一种比较直接的利益表达形式。近年来信访量的激增引发了信访数据的大量聚集,如何将这些信访数据转化成多层次、多维度的信息和知识,揭示数据背后的逻辑关联,从而为政府从政策层面有效解决信访突出矛盾,是信访研究领域所面临的重要问题。实现对信访数据的深层分析,是解决这一难题的必要前提。
目前我们对于信访数据的使用仍然停留在录入、查询、简单统计等表层汇总的层面,无法发现信访数据中隐藏着的深层次的逻辑关联。而这些数据背后的逻辑关联恰是社会矛盾的症结所在,是引导政策制订的重要依据。
发明内容
本发明所要解决的技术问题是针对现有技术没有统一的大数据库,对于信访数据无法根据需要调用,并且无法对信访数据中存在的问题及时解决的不足,提供一种信访数据挖掘评分的方法及系统。
本发明解决上述技术问题的技术方案如下:一种信访数据挖掘评分的方法,包括以下步骤:
步骤1:从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;
步骤2:对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;
步骤3:根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准。
本发明的有益效果是:本发明整合了分散在各个系统并且相互之间孤立的所有信访数据,从信访数据中自动抽取模式、关联、变化、异常和有意义的结构,从越来越大的信访数据中发掘有价值的知识,从而达到用数字反映矛盾规律,用规律促进科学决策的目的。本发明中的信访事项综合评分体系可以预测近期可能会出现的过激信访事项和过激信访人,以引起各相关部门的注意,对社会矛盾预防化解非常有益。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访等数据。
进一步,所述步骤1中从大数据库中抽取信访数据的过程包括:
在大数据库中当有数据发生变化时,通过时间戳条件或者更新日志的方式从大数据库中提取发生变化的数据,得到的数据为符合条件的信访数据。
进一步,所述步骤1对信访数据的处理包括数据清理和数据变换;
所述数据清理将抽取的信访数据清理获得无重复的标准信访数据;
所述数据变换将标准信访数据从事务性数据转换成适合数据挖掘的挖掘数据。
进一步,所述数据清理包括去重、标准化数据项和去噪操作,所述去重将信访数据中重复录入的数据去除;所述标准化数据项将不同形式录入的信访数据按照统一标准排序记录,使处理后的数据更易统计;所述去噪将信访数据中的噪声数据去除。
进一步,所述数据变换的过程包括平滑聚集、数据概化、规范化、概念分层和离散化等操作。
进一步,所述步骤2中的关键词包括过激次数、信访人数、信访次数、信访途径数和信访耗时等。
进一步,所述步骤3中不同关键词根据各自对应的权重值获得与整体评分的百分比,将所有关键词对应的百分比按从大到小排序后建立综合评分标准;其中所述权重值越大所占百分比越大。
本发明解决上述技术问题的技术方案如下:一种信访数据挖掘评分的系统,包括:
抽取模块,从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;
挖掘模块,对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;
标准建立模块,根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访等数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市信访矛盾分析研究中心,未经北京市信访矛盾分析研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610585288.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通讯信息收集方法和装置
- 下一篇:一种组合摄像机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置