[发明专利]一种数据清洗的路由方法、装置、设备及存储介质在审
申请号: | 202310031113.7 | 申请日: | 2023-01-10 |
公开(公告)号: | CN115994135A | 公开(公告)日: | 2023-04-21 |
发明(设计)人: | 吴天柱 | 申请(专利权)人: | 上海中通吉网络技术有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 涂凤琴 |
地址: | 201799 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 清洗 路由 方法 装置 设备 存储 介质 | ||
本发明涉及数据清洗的路由方法、装置、设备及存储介质,属于数据清洗技术领域。本发明包括:根据用户需求为待清洗数据配置对应的路由模型;路由模型包括多个节点,每个节点记载有当前节点的数据内容和当前节点与其他节点之间的依赖关系;根据路由模型中节点之间的依赖关系,确定当前节点对应的清洗方式;根据当前节点的数据内容,为当前节点配置至少一个相应的清洗模板;对每个节点,根据节点对应的清洗模板和清洗方式,对节点进行数据清洗,得到清洗结果,并将满足预设条件的清洗结果发送至与该节点有依赖关系的下级节点,有助于帮助解决快递业务数据在链路流转的过程中出现异常时,使用这些异常数据继续流转造成的影响分析结果的准确性的问题。
技术领域
本发明属于数据清洗技术领域,具体涉及数据清洗的路由方法、装置、设备及存储介质。
背景技术
在快递业务数据的日常清洗过程中,存在数据异常、数据丢失的现象,比如快件的收寄件人省市区地址、所属网点、客户资料、费用明细等关键信息,导致快递业务数据在链路流转的过程中出现异常。由于快递业务数据在链路流转的过程中会经过很多相互依赖的节点,并且不同的分析需求所需要的数据流经的节点也不相同,例如,所属网点信息这一节点的数据依赖收寄件人省市区信息这一节点的数据清洗,账单明细这一节点的数据依赖费用明细信息这一节点的数据清洗,当数据出现异常时,使用这些数据进行继续流转分析,就会影响分析结果。因此,有必要针对快递业务数据进行合规清洗,确保清洗后的数据进入链路流转,提高数据分析的准确性。
发明内容
为此,本发明提供一种数据清洗的路由方法、装置、设备及存储介质,有助于帮助解决由于快递业务数据在链路流转的过程中会经过很多相互依赖的节点,当数据出现异常时,使用这些异常数据继续流转造成的影响分析结果的准确性的问题。
为实现以上目的,本发明采用如下技术方案:
第一方面,本发明提供一种数据清洗的路由方法,其特征在于,包括:
根据用户需求为待清洗数据配置对应的路由模型;所述路由模型包括多个节点,每个节点记载有当前节点的数据内容和当前节点与其他节点之间的依赖关系;
根据所述路由模型中节点之间的依赖关系,确定当前节点对应的清洗方式;
根据所述当前节点的数据内容,为所述当前节点配置至少一个相应的清洗模板;
对每个节点,根据所述节点对应的清洗模板和清洗方式,对所述节点进行数据清洗,得到清洗结果,并将满足预设条件的所述清洗结果发送至与该节点有依赖关系的下级节点。
优选地,所述根据所述路由模型中节点之间的依赖关系,确定当前节点对应的清洗方式,包括:
根据所述路由模型中节点之间的依赖关系,确定所述当前节点的属性为同步或异步;
根据所述当前节点的属性,确定对应的清洗方式。
优选地,所述根据所述路由模型中节点之间的依赖关系,确定所述当前节点的属性为同步或异步,包括:
根据所述路由模型中各节点之间的依赖关系,判断当前节点是否依赖于其他节点,若所述当前节点未依赖于其他节点,确定所述当前节点的属性为同步;
判断所述当前节点是否与其他节点依赖于同一节点,若所述当前节点与其他节点依赖于同一节点,确定所述当前节点的属性为异步;若所述当前节点未与其他节点依赖于同一节点,且所述当前节点所依赖的上级节点的属性为同步,确定所述当前节点的属性为同步或异步。
优选地,所述根据所述当前节点的属性,确定对应的清洗方式,包括:
若所述当前节点的属性为异步,将所述当前节点移交至消息队列进行数据清洗;
若所述当前节点的属性为同步,直接对所述当前节点进行数据清洗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海中通吉网络技术有限公司,未经上海中通吉网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310031113.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可回收的低温注塑材料
- 下一篇:一种用于配电终端的远程测试方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置