[发明专利]一种FTP文件的全文检索方法及装置在审
申请号: | 201710273824.X | 申请日: | 2017-04-24 |
公开(公告)号: | CN107103075A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 金洪殿;李栋梁 | 申请(专利权)人: | 广东浪潮大数据研究有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510620 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ftp 文件 全文 检索 方法 装置 | ||
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种FTP文件的全文检索方法及装置。
背景技术
FTP,即File Transfer Protocol,文件传输协议。支持FTP协议的服务器为FTP服务器。FTP服务器可以在互联网上提供存储空间,依照FTP协议提供服务。
用户通过支持FTP协议的客户机程序,可以连接到远程主机上的FTP服务器程序,进而可以通过客户机程序向服务器程序发出命令,如检索命令,服务器程序执行用户发出的命令,将执行结果返回给客户机程序。
在实际应用中,FTP服务器中存储的文件数量较大,用户多是通过检索方式检索所需的目标文件。目前,服务器程序多是通过将目标词与文件名称进行匹配,确定文件名称包含目标词的文件,作为检索结果返回给客户机程序,输出给用户。
通过这种检索方法查找到的文件较为片面,用户的检索体验较差。
发明内容
本发明的目的是提供一种FTP文件的全文检索方法及装置,以对FTP服务器中的文件进行全面检索,避免检索结果的片面性,提升用户的检索体验。
为解决上述技术问题,本发明提供如下技术方案:
一种FTP文件的全文检索方法,包括:
在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;
针对每个新增文件,建立该新增文件的每个关键词的数据索引;
根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;
在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。
在本发明的一种具体实施方式中,所述在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件,包括:
在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;
针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。
在本发明的一种具体实施方式中,在所述确定该文件为新增文件之后,还包括:
在所述本地配置文件中添加或者更新该文件的修改时间。
在本发明的一种具体实施方式中,所述针对每个新增文件,建立该新增文件的每个关键词的数据索引,包括:
开启多个线程,每个线程对应一个或多个新增文件;
针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;
根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。
在本发明的一种具体实施方式中,利用操作系统的定时任务命令确定所述时间间隔。
在本发明的一种具体实施方式中,针对每个新增文件的每个关键词,该关键词的数据索引包括该关键词在该新增文件中出现的次数、出现的位置。
一种FTP文件的全文检索装置,包括:
新增文件确定模块,用于在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;
数据索引建立模块,用于针对每个新增文件,建立该新增文件的每个关键词的数据索引;
索引库更新模块,用于根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;
检索结果返回模块,用于在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。
在本发明的一种具体实施方式中,所述新增文件确定模块,包括:
修改时间获取子模块,用于在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;
新增文件确定子模块,用于针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。
在本发明的一种具体实施方式中,还包括修改时间更新子模块,用于:
在所述确定该文件为新增文件之后,在所述本地配置文件中添加或者更新该文件的修改时间。
在本发明的一种具体实施方式中,所述数据索引建立模块,具体用于:
开启多个线程,每个线程对应一个或多个新增文件;
针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;
根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710273824.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:净化空调恒温恒湿控制系统
- 下一篇:多子机音响测试箱