[发明专利]脏数据处理方法、装置、设备及存储介质在审
申请号: | 202011596914.0 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112633206A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 李钊;隆世高 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06T7/73 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种脏数据处理方法、装置、设备及存储介质。该方法包括:由脏数据库中读取待处理脏数据,并根据预确定的属性字段对待处理脏数据进行分类标定,得到标定脏数据;获取与标定脏数据对应的待匹配数据;将标定脏数据中的有效属性特征与待匹配数据进行匹配,根据匹配结果对标定脏数据进行补全。本发明实施例的技术方案,通过确定的待匹配数据与标定脏数据进行匹配得到的匹配结果为标定脏数据中缺失的信息进行补全,使得脏数据不被直接丢弃,进而使脏数据中的有效信息得到充分利用,解决了脏数据被直接丢弃而导致其中有效信息被浪费,在进行交通违章追溯中数据缺失的问题,提高了脏数据的可用性以及获取到的数据中有效信息的利用率。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种脏数据处理方法、装置、设备及存储介质。
背景技术
随着汽车在人们的生产生活中扮演的角色日益重要,汽车保有量也日渐增多,且仍在以每年10%-15%的速度增长。由于车辆的猛增使得道路交通压力增大,出现了如道路拥堵、违法驾车和违章停车等违法行为。前端电子警察抓拍得到的过车数据越来越多,违章平台对过车数据进行图像识别后得到的平台过车数据中,存在特征缺失的脏数据也越来越多。
目前针对平台过车数据中确定出的脏数据,如车牌长时间未清洗而导致车牌无法辨认的过车数据,由于无法直接通过脏数据对车辆完整信息进行获取,进而导致无法直接对违章车辆信息进行筛选,因此一般直接对脏数据进行丢弃处理,仅在数据库中存储信息完整的,经结构化处理后的过车数据。
但脏数据中并非所有信息都是无用的,直接将脏数据进行丢弃处理不仅浪费了其中大量的有用数据,且会导致交通违章追溯中的数据缺失,为交通部门的执法造成不便,严重降低了对获取到的过车数据的利用率。
发明内容
本发明提供一种脏数据处理方法、装置、设备及存储介质,以对获取的脏数据进行有效信息的提取和补全,提高了脏数据的可用性以及获取到数据中有效信息的利用率。
第一方面,本发明实施例提供了一种脏数据处理方法,包括:
由脏数据库中读取待处理脏数据,并根据预确定的属性字段对待处理脏数据进行分类标定,得到标定脏数据;
获取与标定脏数据对应的待匹配数据;
将标定脏数据中的有效属性特征与待匹配数据进行匹配,根据匹配结果对标定脏数据进行补全。
第二方面,本发明实施例还提供了一种脏数据处理装置,包括:
数据标定模块,用于由脏数据库中读取待处理脏数据,并根据预确定的属性字段对待处理脏数据进行分类标定,得到标定脏数据;
数据获取模块,用于获取与标定脏数据对应的待匹配数据;
数据补全模块,用于将标定脏数据中的有效属性特征与待匹配数据进行匹配,根据匹配结果对标定脏数据进行补全。
第三方面,本发明实施例还提供了一种计算机设备,包括存储装置、处理器及存储在存储装置上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如本发明任意实施例提供的脏数据处理方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明任意实施例提供的脏数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011596914.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种平面轨迹绘制方法、装置、设备及存储介质
- 下一篇:一种干式脱酸降温设备