[发明专利]数据迁移路径的获取方法、装置和计算机设备在审
申请号: | 201910295665.2 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110134664A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 谢连天 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁;谢曲曲 |
地址: | 518048 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 目的地址 源地址 特征词 数据迁移 计算机设备 获取数据 准确率 迁移 | ||
本发明涉及一种数据迁移路径的获取方法,该方法包括:获取路径语句;确定所述路径语句中的第一特征词和第一结束词,根据所述第一特征词和所述第一结束词获取所述路径语句中的源地址语句;确定所述路径语句中的第二特征词和第二结束词,根据所述第二特征词和第二结束词获取所述路径语句中的目的地址语句;从源地址语句中提取源地址,以及,将所述目的地址语句作为所述目的地址;根据源地址和目的地址获取数据迁移路径。本发明方案能够能够自动从路径语句中提取出源地址和目的地址,从而确定数据迁移路径,效率高,且准确率高。
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据迁移路径的获取方法、装置和计算机设备。
背景技术
当前处理大数据平台的数据时,需要清晰知道各数据的来龙去脉,因此在数据处理过程中需要将数据的源信息和目的信息,也就是数据的迁移路径填写到调度文档里面,然后平台部署时去读取调度文档执行任务。
传统技术采用人工从与数据库集群对应的HQL代码中解析出数据的迁移路径填写到文档中,在HQL任务量较大情况下,人工解析耗时长、效率低。
发明内容
本发明的目的在于提供一种数据迁移路径的获取方法、装置、计算机设备和可读存储介质,能够解决路径语句任务量较大时,人工解析数据迁移路径耗时长、效率低的问题。
本发明的目的通过如下技术方案实现:
一种数据迁移路径的获取方法,所述方法包括:
获取路径语句;
确定所述路径语句中的第一特征词和第一结束词,根据所述第一特征词和所述第一结束词获取所述路径语句中的源地址语句;确定所述路径语句中的第二特征词和第二结束词,根据所述第二特征词和第二结束词获取所述路径语句中的目的地址语句;
从所述源地址语句中提取源地址,以及,将所述目的地址语句作为所述目的地址;所述源地址和所述目的地址用于确定数据迁移路径;
根据所述源地址和目的地址获取数据迁移路径。
在其中一个实施例中,所述确定所述路径语句中的第一特征词和第一结束词,包括:
将所述路径语句中的路径词语和预存的特征词进行匹配,得到所述第一特征词;
将所述路径语句中的路径词语和预存的结束词进行匹配,得到所述第一结束词。
在其中一个实施例中,所述根据所述第一特征词和所述第一结束词获取所述路径语句中的源地址语句,包括:
提取所述第一特征词和所述第一结束词之间的多个路径词语,得到所述源地址语句。
在其中一个实施例中,确定所述路径语句中的第二特征词和第二结束词,包括:
将所述路径语句中的路径词语和预存的特征词进行匹配,得到所述第二特征词;
将所述路径语句中的路径词语和预存的结束词进行匹配,得到所述第二结束词。
在其中一个实施例中,所述根据所述第二特征词和第二结束词获取所述路径语句中的目的地址语句,包括:
提取所述第二特征词和所述第二结束词之间的多个路径词语,得到所述目的地址语句。
在其中一个实施例中,所述从所述源地址语句中提取源地址,包括:
将所述源地址语句中的多个路径词语和预存的特征词进行匹配;
当所述源地址语句中包括与所述特征词相匹配的目标路径词语时,不断提取所述目标路径词语和所述源地址语句的结束符之间的路径词语,得到源地址子语句,直到所述源地址子语句中不包括与所述特征词相匹配的目标路径词语,将所述源地址子语句,作为所述源地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910295665.2/2.html,转载请声明来源钻瓜专利网。