[发明专利]一种从简历库中快速检索简历的方法有效

专利信息
申请号: 201110216654.4 申请日: 2011-07-29
公开(公告)号: CN102231168A 公开(公告)日: 2011-11-02
发明(设计)人: 俞希林;孔卫东 申请(专利权)人: 前锦网络信息技术(上海)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海新天专利代理有限公司 31213 代理人: 周涛
地址: 201203 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 简历 快速 检索 方法
【说明书】:

技术领域

发明涉及到搜索引擎,特别是一种从简历库中快速检索出简历文件的方法搜索引擎。

背景技术

在招聘行业中,大部分网站都采用数据库搜索的方式来实现简历数据的检索。这种数据库搜索技术适用于简历数据量较小的网站,但是一旦简历数量巨大且增长过快,例如达到三千万条的数量,使用普通的数据库技术进行简历搜索时,在巨量的简历数据面前,其检索性能就非常差。特别是在搜索关键字时,处于web客户端的用户响应速度很慢,需要几秒到几十秒,甚至出现部分关键字搜索无法获得搜索结果。针对这种情形,作为简历搜索者的企事业单位用户常常投诉简历搜索速度过慢,搜索效果太差。

在目前的技术条件下,由于数据库的简历数量非常大,很难直接通过硬件扩展的方式来大幅度提高系统性能,并且对硬件扩展和升级的成本也较高。总结现有技术存在的问题主要在于两点:第一是企业用户简历库搜索简历时搜索速度过慢;第二是搜索结果不完整,很多搜索引擎只返回部分结果,并且搜索引擎本身使用词库的方式来建立索引,不能保证简历库中的所有数据都能够被有效检索。

发明内容

本发明的目的在于克服上述现有技术存在的不足,提供一种新的从巨量简历库中快速检索简历的方法。本发明的搜索方法要能够实现简历数据库内的所有简历都能够快速有效地被检索出来,在保证检索准确性的情况下要能大幅提高检索速度。

为了达到上述发明目的,本发明提供的技术方案如下:

一种从简历库中快速检索简历的方法,其特征在于,该方法是在简历数据库与web服务器之间设置一个简历搜索引擎,利用该简历搜索引擎将简历的全文关键字进行快速索引,通过按字索引的方式使简历数据库中存在的简历数据能够快速有效地被检索出并在web服务器中呈现出来。

上述从简历库中快速检索简历的方法主要包括有简历索引生成阶段和简历索引搜索服务阶段:

在简历索引生成阶段:

第一步,将简历数据库中的简历按照更新时间进行降序排列,以降序读取新增、修改、逻辑删除的简历数据;

第二步,扫描每份简历在数据库中的索引字段,按照月份生成索引文件,索引文件包括文件头段落、精确搜索段落、字索引段落和详细位置信息段落,每天更新生成当月的索引文件,该索引文件通过复制的方式更新数据至索引服务器上;

在简历索引搜索服务阶段:

第三步,所述的索引服务器为多线程模块,其包括有主线程、工作线程和监控线程,主线程通过套接字在指定端口8454监听搜索请求,若有搜索请求则将其转给工作线程处理;

第四步,工作线程接收Web客户端的搜索请求并将搜索请求信息解析,如果不包含关键字,直接进行精确搜索段落的判断,如果包含关键字,则通过字索引段落,找到每个关键字的详细位置信息的起始位置,判断是否符合搜索请求,如果关键字满足搜索请求,则继续判断精确搜索段落是否满足搜索请求,如果都满足搜索请求,则将简历ID放入搜索结果中,搜索完成后返回客户端;

第五步,监控线程定时扫描文件更新,若索引文件正在更新,则将当前服务器的搜索请求转移到备份服务器上搜索。

在本发明的从简历库中快速检索简历的方法中,所述第二步的索引文件中文件头段落包含的统计信息包括精确搜索段落,字索引段落,详细位置信息段落在文件中的起始位置,每个节点的大小,以及节点的数量;精确搜索段落包括自增长的内部ID,数据库的简历ID,居住地,学历,性别,工作年限,简历更新时间以及状态信息;字索引段落包括汉字和英文信息,每个汉字为一个节点,每个英文单词为一个单独节点;详细位置信息段落记录字的内部ID、字段以及位置信息。

在本发明的从简历库中快速检索简历的方法中,所述第四步中查找关键字的详细位置信息时,对比每个关键字的前后位置信息,若所有关键字都满足位置信息,则该条记录满足关键字搜索条件,如果同时满足精确搜索条件,就可以提取该简历ID至搜索结果集。

基于上述技术方案,本发明的从简历库中快速检索简历的方法与现有技术相比具有如下技术优点:

1.本发明的简历库搜索方法可以实现简历库内所有简历数据的全文关键字的快速搜索,并且按字索引,从而保证了简历数据库内存在的数据都能够有效地被检索出来。

2.企业用户利用本发明的搜索引擎可以从包含大量简历的数据库中快速准确地进行关键字检索以及部分信息的精确检索,从而解决了搜索速度慢的问题,使得企业用户能够快速的找到需要的简历文件。

附图说明

图1是本发明从简历库中快速检索简历的方法的总体思路示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前锦网络信息技术(上海)有限公司,未经前锦网络信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110216654.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top