[发明专利]一种智慧警务数据融合清洗研判装置在审
申请号: | 202110041378.6 | 申请日: | 2021-04-28 |
公开(公告)号: | CN112965960A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 管连兵 | 申请(专利权)人: | 贵州申瓯通信电子科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2455;G06F16/2457;G06F16/2458;G06F16/28;G06Q50/26 |
代理公司: | 南昌逸辰知识产权代理事务所(普通合伙) 36145 | 代理人: | 刘阳阳 |
地址: | 550002 贵州省贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智慧 警务 数据 融合 清洗 研判 装置 | ||
1.一种智慧警务数据清洗方法,其特征在于,包括:
从预设的数据库中获取需要清洗的警务数据;
对所述警务数据进行分析得到数据特征,根据预设的数据分类模板对所述数据特征进行匹配,得到与所述数据特征匹配的警务数据类型,并将所述警务数据记为与所述警务数据类型对应的目标数据;
将所述目标数据分配至与所述数据类型匹配的处理队列,不同的警务数据类型对应不同的处理队列;
从所述处理队列中取出所述目标数据,并判断所述目标数据是否为时间序列型数据;
若否,则检测所述目标数据的缺失数据记录,依据所述缺失数据记录补全所述目标数据中的缺失数据,得到补全数据;
对所述补全数据进行错误检测,并依据所述错误检测的结果对所述补全数据进行修正,得到修正数据;
对所述修正数据进行相似重复记录检测,并依据检测结果剔除所述修正数据中的相似重复数据,得到经过清洗过的干净警务数据;
将所述干净警务数据依据警务业务需求分配至指定的警务业务系统。
2.根据权利要求1所述的智慧警务数据清洗方法,其特征在于,所述警务数据类型为交通数据类型,所述检测所述目标数据的缺失数据记录,依据所述缺失数据记录补全所述目标数据中的缺失数据,得到补全数据的步骤,包括:
扫描所述交通数据以确定所述目标数据是否存在所述缺失数据;
若是,则将所述交通数据进行分割,得到多个路段数据,并从多个所述路段数据中解析出存在所述缺失数据的路段数据的位置信息;
获取所述交通数据的历史数据,依据所述历史数据分析得到多个具有相似变换规律的规律路段数据,并依据所述位置信息在各个所述规律路段数据中找到与所述缺失数据对应的片段;
计算各个片段的均值,并将所述均值补充至所述交通数据中与所述片段对应的位置,得到所述补全数据。
3.根据权利要求1所述的智慧警务数据清洗方法,其特征在于,所述对所述修正数据进行相似重复记录检测的步骤,包括:
从所述修正数据中选择一个或多个字段创建一个索引;
将所述修正数据中每条记录按照索引排序,并将排序好的记录移入计算窗口;
将所述计算窗口内的第一条记录与所述计算窗口内剩下的N-1条记录分别进行相似度计算,得到所述第一条记录与剩下各所述记录的相似度值,以获得所述第一条记录的相似重复数据;
当所述计算窗口中的第一条记录与所述滑动窗口内剩余N-1条记录都计算完成后,将所述第一条记录滑出所述计算窗口,重复计算所述计算窗口内的记录,直至所述计算窗口内的所有记录遍历所述第一记录的计算过程,得到多个所述相似重复数据。
4.根据权利要求3所述的智慧警务数据清洗方法,其特征在于,所述将所述计算窗口内的第一条记录与所述计算窗口内剩下的N-1条记录分别进行相似度计算的步骤,包括:
分别计算所述第一条记录的字符串与剩下的N-1条记录的字符串的编辑距离、最长公共子序列长度以及最长公共子串长度;
依据所述编辑距离、最长公共子序列长度以及最长公共子串长度计算得到对应的相似度值;
其中,利用以下公式计算得到所述相似度值:
其中,S为相似度值,A为平衡因子,L为所述最长公共子串长度;K为所述第一条记录的字符串与另一记录字符串两者中较长的字符串长度;S1=L1÷(D+L1),D为所述编辑距离,L1为所述最长公共子序列长度。
5.根据权利要求1所述的智慧警务数据清洗方法,其特征在于,所述判断所述目标数据是否为时间序列型数据的步骤之后,包括:
当判定所述目标数据为时间序列型数据,则对所述目标数据进行检测,以确定所述目标数据的错误类型;
依据所述目标数据的错误类型采用对应的清洗算法对所述目标数据进行清洗,得到经过清洗过的干净警务数据;
将所述干净警务数据依据警务业务需求分配至指定的警务业务系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州申瓯通信电子科技有限公司,未经贵州申瓯通信电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110041378.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置