[发明专利]一种信访数据挖掘评分方法及系统有效

专利信息
申请号: 201610585288.2 申请日: 2016-07-25
公开(公告)号: CN106294542B 公开(公告)日: 2018-03-30
发明(设计)人: 张宗林 申请(专利权)人: 北京市信访矛盾分析研究中心
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100005 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 信访 数据 挖掘 评分 方法 系统
【说明书】:

技术领域

发明涉及一种信访数据挖掘评分的方法及系统,属于计算机技术领域。

背景技术

信访,是指公民、法人或者其它组织采用书信、电子邮件、传真、电话、走访等形式,向各级人民政府、县级以上人民政府工作部门反映情况,提出建议、意见或者投诉请求,依法由有关行政机关处理的活动。

信访是除法律以外的又一种解决问题的办法,是一种比较直接的利益表达形式。近年来信访量的激增引发了信访数据的大量聚集,如何将这些信访数据转化成多层次、多维度的信息和知识,揭示数据背后的逻辑关联,从而为政府从政策层面有效解决信访突出矛盾,是信访研究领域所面临的重要问题。实现对信访数据的深层分析,是解决这一难题的必要前提。

目前我们对于信访数据的使用仍然停留在录入、查询、简单统计等表层汇总的层面,无法发现信访数据中隐藏着的深层次的逻辑关联。而这些数据背后的逻辑关联恰是社会矛盾的症结所在,是引导政策制订的重要依据。

发明内容

本发明所要解决的技术问题是针对现有技术没有统一的大数据库,对于信访数据无法根据需要调用,并且无法对信访数据中存在的问题及时解决的不足,提供一种信访数据挖掘评分的方法及系统。

本发明解决上述技术问题的技术方案如下:一种信访数据挖掘评分的方法,包括以下步骤:

步骤1:从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;

步骤2:对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;

步骤3:根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准。

本发明的有益效果是:本发明整合了分散在各个系统并且相互之间孤立的所有信访数据,从信访数据中自动抽取模式、关联、变化、异常和有意义的结构,从越来越大的信访数据中发掘有价值的知识,从而达到用数字反映矛盾规律,用规律促进科学决策的目的。本发明中的信访事项综合评分体系可以预测近期可能会出现的过激信访事项和过激信访人,以引起各相关部门的注意,对社会矛盾预防化解非常有益。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访等数据。

进一步,所述步骤1中从大数据库中抽取信访数据的过程包括:

在大数据库中当有数据发生变化时,通过时间戳条件或者更新日志的方式从大数据库中提取发生变化的数据,得到的数据为符合条件的信访数据。

进一步,所述步骤1对信访数据的处理包括数据清理和数据变换;

所述数据清理将抽取的信访数据清理获得无重复的标准信访数据;

所述数据变换将标准信访数据从事务性数据转换成适合数据挖掘的挖掘数据。

进一步,所述数据清理包括去重、标准化数据项和去噪操作,所述去重将信访数据中重复录入的数据去除;所述标准化数据项将不同形式录入的信访数据按照统一标准排序记录,使处理后的数据更易统计;所述去噪将信访数据中的噪声数据去除。

进一步,所述数据变换的过程包括平滑聚集、数据概化、规范化、概念分层和离散化等操作。

进一步,所述步骤2中的关键词包括过激次数、信访人数、信访次数、信访途径数和信访耗时等。

进一步,所述步骤3中不同关键词根据各自对应的权重值获得与整体评分的百分比,将所有关键词对应的百分比按从大到小排序后建立综合评分标准;其中所述权重值越大所占百分比越大。

本发明解决上述技术问题的技术方案如下:一种信访数据挖掘评分的系统,包括:

抽取模块,从大数据库中抽取符合条件的信访数据进行处理,得到适合数据挖掘的挖掘数据存入挖掘数据库中,所述大数据库中保存所有历史信访数据;

挖掘模块,对挖掘数据库中的挖掘数据提取至少一个关键词,基于每个关键词对挖掘数据进行特征提取,得到针对每个关键词的分析表;

标准建立模块,根据对至少一个分析表中的挖掘数据进行统计分析,得到针对每个关键词的一个权重值,基于不同关键词各自对应的权重值建立综合评分标准。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述大数据库中预存的信访数据包括通过数据采集获得的信件、电子邮件、语音、视频及来访等数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市信访矛盾分析研究中心,未经北京市信访矛盾分析研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610585288.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top