[发明专利]一种FTP文件的全文检索方法及装置在审

专利信息
申请号: 201710273824.X 申请日: 2017-04-24
公开(公告)号: CN107103075A 公开(公告)日: 2017-08-29
发明(设计)人: 金洪殿;李栋梁 申请(专利权)人: 广东浪潮大数据研究有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 罗满
地址: 510620 广东省广州市天河区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 ftp 文件 全文 检索 方法 装置
【说明书】:

技术领域

发明涉及计算机应用技术领域,特别是涉及一种FTP文件的全文检索方法及装置。

背景技术

FTP,即File Transfer Protocol,文件传输协议。支持FTP协议的服务器为FTP服务器。FTP服务器可以在互联网上提供存储空间,依照FTP协议提供服务。

用户通过支持FTP协议的客户机程序,可以连接到远程主机上的FTP服务器程序,进而可以通过客户机程序向服务器程序发出命令,如检索命令,服务器程序执行用户发出的命令,将执行结果返回给客户机程序。

在实际应用中,FTP服务器中存储的文件数量较大,用户多是通过检索方式检索所需的目标文件。目前,服务器程序多是通过将目标词与文件名称进行匹配,确定文件名称包含目标词的文件,作为检索结果返回给客户机程序,输出给用户。

通过这种检索方法查找到的文件较为片面,用户的检索体验较差。

发明内容

本发明的目的是提供一种FTP文件的全文检索方法及装置,以对FTP服务器中的文件进行全面检索,避免检索结果的片面性,提升用户的检索体验。

为解决上述技术问题,本发明提供如下技术方案:

一种FTP文件的全文检索方法,包括:

在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;

针对每个新增文件,建立该新增文件的每个关键词的数据索引;

根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;

在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。

在本发明的一种具体实施方式中,所述在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件,包括:

在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;

针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。

在本发明的一种具体实施方式中,在所述确定该文件为新增文件之后,还包括:

在所述本地配置文件中添加或者更新该文件的修改时间。

在本发明的一种具体实施方式中,所述针对每个新增文件,建立该新增文件的每个关键词的数据索引,包括:

开启多个线程,每个线程对应一个或多个新增文件;

针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;

根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。

在本发明的一种具体实施方式中,利用操作系统的定时任务命令确定所述时间间隔。

在本发明的一种具体实施方式中,针对每个新增文件的每个关键词,该关键词的数据索引包括该关键词在该新增文件中出现的次数、出现的位置。

一种FTP文件的全文检索装置,包括:

新增文件确定模块,用于在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;

数据索引建立模块,用于针对每个新增文件,建立该新增文件的每个关键词的数据索引;

索引库更新模块,用于根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;

检索结果返回模块,用于在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。

在本发明的一种具体实施方式中,所述新增文件确定模块,包括:

修改时间获取子模块,用于在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;

新增文件确定子模块,用于针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。

在本发明的一种具体实施方式中,还包括修改时间更新子模块,用于:

在所述确定该文件为新增文件之后,在所述本地配置文件中添加或者更新该文件的修改时间。

在本发明的一种具体实施方式中,所述数据索引建立模块,具体用于:

开启多个线程,每个线程对应一个或多个新增文件;

针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;

根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710273824.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top