[发明专利]一种文件处理方法及装置、存储介质及电子设备在审
申请号: | 202310141784.9 | 申请日: | 2023-02-21 |
公开(公告)号: | CN116011438A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 鲁士琦 | 申请(专利权)人: | 中银金融科技有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/205;G06F16/332;G06F16/31;G06F16/242;G06F16/248 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郄晨芳 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 处理 方法 装置 存储 介质 电子设备 | ||
1.一种文件处理方法,其特征在于,应用于处理系统,包括:
按预设周期,从数据源网站中获取多个目标文件;
对各个目标文件进行解析,得到每个目标文件的标题和目录结构数据;
针对每个目标文件,基于所述目标文件的标题和目录结构数据,判断预设的增量表中是否存在与所述目标文件的标题和目录结构数据均匹配的数据,若不存在,则按照所述目录结构数据,将所述目标文件存储至所述处理系统的结构化数据库中,并将所述目标文件的标题和目录结构数据写入至所述增量表中;其中,所述结构化数据库预先链接至所述处理系统的前端页面;
接收通过所述前端页面输入的查询请求;所述查询请求中包括至少一个关键词;
基于所述查询请求中包括的关键词,从所述结构数据库中筛选满足所述关键词的目标文件;
对所筛选出的目标文件进行可视化显示。
2.根据权利要求1所述的方法,其特征在于,所述从数据源网站中获取多个目标文件,包括:
基于数据源网站的统一资源定位符,定位所述数据资源网站;
基于网站认证信息和检索配置信息,从所述数据源网站中获取满足所述检索配置信息的多个目标文件。
3.根据权利要求1所述的方法,其特征在于,所述对各个目标文件进行解析,得到每个目标文件的标题和目录结构数据,包括:
获取每个目标文件所属期刊的期刊类型;
针对每个目标文件,基于所述目标文件所属期刊的期刊类型,从预设的解析策略中确定与所述期刊类型对应的解析策略,并基于与所述期刊类型对应的解析策略,对所述目标文件进行解析,得到所述目标文件的标题和目录结构数据。
4.根据权利要求3所述的方法,其特征在于,所述按照所述目录结构数据,将所述目标文件存储至所述处理系统的结构化数据库中,包括:
基于所述目标文件所属期刊的期刊类型,从预设的目录存储模板中确定目标目录存储模板;
将所述目标文件的目录结构数据写入至目标目录存储模板,并将写入目录结构数据的目标目录模板和所述目标文件存储至所述处理系统的结构化数据库中。
5.一种文件处理装置,其特征在于,应用于处理系统,包括:
获取单元,用于按预设周期,从数据源网站中获取多个目标文件;
解析单元,用于对各个目标文件进行解析,得到每个目标文件的标题和目录结构数据;
判断单元,用于针对每个目标文件,基于所述目标文件的标题和目录结构数据,判断预设的增量表中是否存在与所述目标文件的标题和目录结构数据均匹配的数据,若不存在,则按照所述目录结构数据,将所述目标文件存储至所述处理系统的结构化数据库中,并将所述目标文件的标题和目录结构数据写入至所述增量表中;其中,所述结构化数据库预先链接至所述处理系统的前端页面;
接收单元,用于接收通过所述前端页面输入的查询请求;所述查询请求中包括至少一个关键词;
筛选单元,用于基于所述查询请求中包括的关键词,从所述结构数据库中筛选满足所述关键词的目标文件;
显示单元,用于对所筛选出的目标文件进行可视化显示。
6.根据权利要求5所述的装置,其特征在于,所述第一获取单元,具体用于:
基于数据源网站的统一资源定位符,定位所述数据资源网站;
基于网站认证信息和检索配置信息,从所述数据源网站中获取满足所述检索配置信息的多个目标文件。
7.根据权利要求5所述的装置,其特征在于,所述解析单元,具体用于:
获取每个目标文件所属期刊的期刊类型;
针对每个目标文件,基于所述目标文件所属期刊的期刊类型,从预设的解析策略中确定与所述期刊类型对应的解析策略,并基于与所述期刊类型对应的解析策略,对所述目标文件进行解析,得到所述目标文件的标题和目录结构数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中银金融科技有限公司,未经中银金融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310141784.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无人零售柜购物数据的采集方法、装置、电插锁及介质
- 下一篇:一种茶叶解块机