[发明专利]一种基于Apriori的公安交管业务异常数据研判方法有效
申请号: | 201811560819.8 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109767617B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王家捷;吕建成;叶明辉;吕潭;裴有斌 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06F16/2458 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 apriori 公安 交管 业务 异常 数据 研判 方法 | ||
本发明公开了一种基于Apriori的公安交管业务异常数据研判方法,其步骤如下:针对数据库中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据;整合数据库中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化;根据Apriori算法,生成候选项集Ck和频繁项集Lk。当数据库D2增加新的数据集d时,引入参数i(1i∞),计算新的频繁项集Lk’。根据强关联规则和交管业务历史数据,建立数据异常研判模型。该方法建立了异常数据研判模型,能够快速有效地检测到交管业务数据中的异常数据,解决目前公安交管业务数据存在大量异常数据人工分析效率低、范围小等实际问题。
技术领域
本发明涉及交通数据分析领域。具体而言是一种基于Apriori的公安交管业务异常数据研判方法。
背景技术
近年来,各级公安交管部门在智能交通管理和车管、驾管、违法、事故等业务管理建立了较为完整的信息化应用体系,围绕人、车、违法、事故等核心业务对象建立了综合业务数据库,在公安交通管理和服务方面发挥着重要支撑作用。但是,随着业务不断深入开展和系统建设的快速发展,特别是围绕核心业务数据库开展综合分析与数据挖掘需求越来越强烈,现有数据库中数据缺项、业务逻辑错误、均值偏离等问题逐步显现,对自动查找错项数据、自主研判业务异常等提升异常数据研判和分析效率的系统需求强烈。目前,一些深层次的业务逻辑问题和异常状态数据的发现还主要依靠分析人员的工作经验,缺乏系统的、有效的异常数据识别方法,评估效率低、覆盖范围小、难以为业务开展提供很好的指导作用。
发明内容
本发明的目的在于提出一种基于Apriori的公安交管业务异常数据研判方法,将Apriori算法应用于公安交管业务数据分析中,提高公安交管人员的数据分析效率,扩大数据分析覆盖范围。
为实现上述发明目的,本发明采用如下的技术方案:
步骤一:建立公安交管业务数据库D1。
本发明涉及的公安交管业务数据包括机动车登记数据、驾驶证管理数据、交通事故处理数据、交通违法处理数据、剧毒化学品公路运输数据、交警队基础信息数据。
步骤二:针对数据库D1中的数量属性字段,利用极大极小值、线性模型或者确定性的函数关系模型识别异常数据。
(1)通过极大极小值建立字段的正常逻辑范围,当该字段的输入数据超出正常范围时,则判定为异常数据;
(2)对存在一元线性关系的字段,建立线性模型,偏离直线的数值判定为异常数据;
(3)对存在其他确定性函数关系的字段,建立函数关系,判断数据异常。
步骤三:整合数据库D1中未建立异常数据识别规则的字段,建立数据库D2,对数据库D2中的数量属性字段进行离散化。
步骤四:根据Apriori算法,生成候选项集和频繁项集。
(1)设置最小支持度min_sup和最小置信度min_conf;
(2)扫描数据库D2,计算D2中每个数据项出现的次数,生成候选1项集C1;
(3)计算C1中每个项的支持度,若支持度大于等于min_sup,则从C1中确定频繁1项集L1;
(4)将L1与自身相连接产生候选2项集C2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811560819.8/2.html,转载请声明来源钻瓜专利网。