[发明专利]有效数据提取方法、装置、存储介质及终端在审
申请号: | 201811510383.1 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109614622A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 火一莽;王如意;石志中;张俊杰 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标文件 有效数据 预设 有效数据提取 存储介质 第一数据 目标数据 遍历 终端 关键字匹配 模板提取 提取效率 预设位置 载入 申请 | ||
本申请实施例公开了一种有效数据提取方法、装置、存储介质及终端,该方法包括:首先,载入目标文件,拆分目标文件,得到多个第一数据;然后,根据预设位置从第一数据中确定第二数据,从第二数据开始遍历,将当前遍历的数据作为目标数据;最后,如果目标数据与预设关键字匹配,则根据预设关键字对应的获取模板提取有效数据,能够基于预设关键字从目标文件中提取有效数据,提高有效数据的提取效率。
技术领域
本申请实施例涉及移动终端技术领域,尤其涉及有效数据提取方法、装置、存储介质及终端。
背景技术
随着大数据的飞速发展,文本信息的数据量也是暴增,文本内容中同样包含大量各行各业所需的信息。在获取文本信息的过程中发现,文本信息中除了包含有效数据,还包括许多冗余数据,如广告信息等。此时,从文本信息中提取出的数据将包括冗余数据,不仅占用了存储空间且在后续数据分析时会出现资源浪费的问题。可见,如何高效的提取文本信息中的有效数据成为亟待解决的问题。
发明内容
本申请实施例的目的是提供一种有效数据提取方法、装置、存储介质及终端,可以提高有效数据的提取效率。
第一方面,本申请实施例提供了一种有效数据提取方法,包括:
载入目标文件,拆分所述目标文件,得到多个第一数据;
根据预设位置从所述第一数据中确定第二数据,从所述第二数据开始遍历,将当前遍历的数据作为目标数据;
如果所述目标数据与预设关键字匹配,则根据所述预设关键字对应的获取模板提取有效数据。
第二方面,本申请实施例提供了一种有效数据提取装置,包括:
载入模块,用于载入目标文件;
拆分模块,用于拆分所述载入模块载入的所述目标文件,得到多个第一数据;
遍历模块,用于根据预设位置从所述拆分模块得到的所述第一数据中确定第二数据,从所述第二数据开始遍历,将当前遍历的数据作为目标数据;
提取模块,用于如果所述目标数据与预设关键字匹配,则根据所述预设关键字对应的获取模板提取有效数据。
第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所示的有效数据提取方法。
第四方面,本申请实施例提供了一种终端,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,处理器执行计算机程序时实现如第一方面所示的有效数据提取方法。
本申请实施例提供的有效数据提取的方案,首先,载入目标文件,拆分所述目标文件,得到多个第一数据;然后,根据预设位置从所述第一数据中确定第二数据,从所述第二数据开始遍历,将当前遍历的数据作为目标数据;最后,如果所述目标数据与预设关键字匹配,则根据所述预设关键字对应的获取模板提取有效数据,能够基于预设关键字从目标文件中提取有效数据,提高有效数据的提取效率。
附图说明
图1为本申请实施例提供的一种有效数据提取方法的流程示意图;
图2为本申请实施例提供的另一种有效数据提取方法的流程示意图;
图3为本申请实施例提供的另一种有效数据提取方法的流程示意图;
图4为本申请实施例提供的另一种有效数据提取方法的流程示意图;
图5为本申请实施例提供的另一种有效数据提取方法的流程示意图;
图6为本申请实施例提供的另一种有效数据提取方法的流程示意图;
图7为本申请实施例提供的一种有效数据提取装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811510383.1/2.html,转载请声明来源钻瓜专利网。