[发明专利]一种提取数据信息的方法、装置、设备及存储介质在审
申请号: | 201810163956.1 | 申请日: | 2018-02-27 |
公开(公告)号: | CN108334634A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 陈晓泰;朱国壮;王能 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100025 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 待处理数据 提取数据 模板提取 变更 计算机可读存储介质 存储介质 获取数据 逻辑解析 预先设置 申请 解析 | ||
本申请公开了一种提取数据信息的方法,包括获取数据的提取要求;再根据预先设置的提取逻辑解析提取要求,得到提取模板;然后获取待处理数据,并利用提取模板提取待处理数据的信息。可见,在提取要求变更时,本方法能够根据提取逻辑再次进行解析得到变更后的提取模板,然后获取待处理数据并利用变更后的提取模板提取待处理数据的信息。从而避免了再次编写提取要求对应的代码的繁琐以及编写代码所带来的风险,提高了提取数据信息的效率,同时提高了系统的稳定性。本申请还公开了一种提取数据信息的装置、设备及计算机可读存储介质,均具有上述有益效果。
技术领域
本发明涉及数据处理领域,特别涉及一种提取数据信息的方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网技术的快速发展,各种各样的数据不断地沉淀和积累,但是在这些数据中,可能存在有价值的信息。因此,需要对这些数据进行二次利用,提取出有价值的信息。
现有技术中,提取大量数据中的有价值的信息的方式一般为预先定义提取要求,然后根据提取要求开发出对应的代码,再利用对应的代码提取待处理数据的信息,以获得待处理数据中提取要求对应的信息。但是面对互联网的快速迭代和各种复杂多变的需求,提取要求常常会发生改变,对应的在提取要求改变后,现有技术的提取数据信息的方式必须根据变更后的提取要求对代码进行重写或修改,再重新测试、上线,然后才能再利用更改后的代码提取待处理数据的信息。这样一来,将耗费大量的人力,并且编写、修改代码的过程不仅繁琐,还会带来风险,因此系统的稳定性也将受到影响。
因此,如何提高提取数据信息的效率是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种提取数据信息的方法,能够提高提取数据信息的效率;本发明的另一目的是提供一种提取数据信息的装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种提取数据信息的方法,包括:
获取数据的提取要求;
根据预先设置的提取逻辑解析所述提取要求,得到提取模板;
获取待处理数据,并利用所述提取模板提取所述待处理数据的信息。
优选地,所述根据预先设置的提取逻辑解析所述提取要求,得到提取模板具体为:
利用SQL引擎和/或http引擎根据预先设置的提取逻辑解析所述提取要求,得到对应的提取模板。
优选地,所述利用所述提取模板提取所述待处理数据的信息具体为:
采用多线程的方式利用所述提取模板提取所述待处理数据的信息。
优选地,在所述获取数据的提取要求之后进一步包括:
将获取的所述提取要求进行缓存。
优选地,在所述将获取的所述提取要求进行缓存之后进一步包括:
在接收到新的提取要求时,判断所述新的提取要求与缓存的提取要求是否相同;
若否,则利用所述新的提取要求更新所述缓存的提取要求。
优选地,进一步包括:
提示输入所述提取要求。
为解决上述技术问题,本发明还提供一种提取数据信息的装置,包括:
获取模块,用于获取数据的提取要求;
解析模块,用于根据预先设置的提取逻辑解析所述提取要求,得到提取模板;
提取模块,用于获取待处理数据,并利用所述提取模板提取所述待处理数据的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810163956.1/2.html,转载请声明来源钻瓜专利网。