[发明专利]一种公安交管业务异常数据综合研判方法及系统有效
申请号: | 201811560911.4 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109767618B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 王家捷;李国强;刘俊;苟启文;李冬亮 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06F16/215;G06F16/2458 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公安 交管 业务 异常 数据 综合 研判 方法 系统 | ||
本发明公开了一种公安交管业务异常数据综合研判方法及系统,具体技术方案如下:对数据进行预处理,完成数据清洗、数据转换、数据集成等工作;构建正则表达式库,对数据进行处理,规范数据表达;通过Apriori算法分析公安交管业务历史数据之间的关联规则,建立异常数据研判模型;利用软件在环检测技术,实时检测异常数据并对数据进行整合分析。本发明能够快速有效地检测公安交管业务数据中的异常数据,为公安交管业务异常数据分析研判的常态化开展提供有效的技术保障。
技术领域
本发明涉及交通数据分析领域。具体而言是一种公安交管业务异常数据综合研判方法及系统。
背景技术
随着公安交通管理综合应用平台(简称“综合应用平台”,又称“六合一”)的广泛应用,该系统已经成为各级公安交管部门业务开展的核心平台,对提升各级交管业务部门管理能力和服务水平起到了不可替代的重要作用。但是,由于一线干警在对信息系统的理解和重视程度参差不齐,在信息录入时随意性较大,部分地区录入偏好于“其它”等公用类型,同时伴随实际业务开展逐步完善的系统功能建设也产生大量历史数据等现实问题,导致核心业务数据中仍然大量存在空白字段、身份号码中性别与性别字段不符、关键指标大幅偏离均值等现象,大大降低了这些“种子数据”在综合研判和数据分析中的关键作用,也无法很好地为相关业务数据关联关系的建立发挥“传导介质”作用。一些深层次的业务逻辑问题和异常状态数据的发现还主要依靠分析人员的工作经验,评估效率低、覆盖范围小、难以为业务开展提供很好的指导作用等问题还比较突出。
发明内容
本发明的目的在于提供一种公安交管业务异常数据综合研判方法及系统,以解决上述背景技术中提出的问题。
为实现上述发明目的,本发明采用如下的技术方案:
一种公安交管业务异常数据综合研判方法,其实现步骤如下:
步骤一:数据预处理。
将采集到的数据进行汇总,传入数据库,并做数据清洗、数据转换、数据集成等工作。
步骤二:建立正则表达式库,对数据进行处理。
2.1对步骤一预处理后的业务数据,分析业务数据构成规则,确定业务数据的重点关注字段;
2.2根据重点关注字段的类型和属性,设计各重点关注字段的正则表达式,构建正则表达式库;
2.3根据建立的正则表达式库,分析公安交管业务数据中的异常录入数据,并对异常录入数据进行修正,建立公安交管业务数据库D1。
步骤三:建立异常数据研判模型。
通过Apriori算法分析公安交管业务历史数据之间的关联规则,进而通过关联规则对业务异常数据进行分析研判。
3.1针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;
3.2整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;
3.3根据Apriori算法,生成候选项集Ck和频繁项集Lk;
3.4当数据库D2增加新的数据集d时,引入参数i(1i∞),计算新的频繁项集Lk';
3.5计算强关联规则;
3.6根据强关联规则和交管业务历史数据,建立数据异常研判模型。
步骤四:异常数据实时在环检测。
通过软件在环检测技术,实时检测异常数据并对数据进行整合分析,为车管、驾管、违法、事故等业务开展提供数据基础,减少对业务工作正常开展的不利影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811560911.4/2.html,转载请声明来源钻瓜专利网。