[发明专利]一种简历快速搜索方法、系统和存储介质在审
申请号: | 201910342733.6 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110083607A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 毕昀 | 申请(专利权)人: | 毕昀 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455 |
代理公司: | 北京一品慧诚专利代理事务所(普通合伙) 11762 | 代理人: | 黄岳巍 |
地址: | 100025 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快速搜索 简历数据 搜索 索引 存储步骤 存储介质 存储 分布式方式 检索关键词 搜索结果 索引生成 返回 保证 | ||
本发明提供一种简历快速搜索方法、系统和存储介质。所述简历快速搜索方法包括:简历获取和存储步骤,其获取简历数据并将简历数据存储到简历库中;索引生成和存储步骤,其基于所述简历数据生成索引并以分布式方式存储所述索引;搜索步骤,其基于接收到的检索关键词在所述索引中进行搜索,并返回搜索结果。该简历快速搜索方法能够实现简历快速搜索,在保证搜索准确性的前提下,提高简历搜索速度。
技术领域
本发明涉及搜索领域,特别涉及一种简历快速搜索方法、系统和存储介质。
背景技术
随着互联网快速发展,网络招聘已经成为主流的招聘方式。越来越多的求职者开始通过互联网上所提供的各种招聘服务来寻找自己的工作,而企业也开始越来越多的使用互联网来寻找适合企业发展的人才。简历搜索是招聘网站或猎头网站最基本和最常用的功能。目前很多网站采用单机搜索技术,但是,这种单机搜索技术往往无法高效应对庞大数量的简历,在即时插入、即时搜索时会阻塞线程,导致网站响应速度变慢,搜索效率变低,严重影响用户体验。
发明内容
为了解决上述问题,本发明提供了一种简历快速搜索方法,其能够实现简历快速搜索,在保证搜索准确性的前提下,提高简历搜索速度。
为了实现上述目的,本发明提供一种简历快速搜索方法,其特征在于,该方法包括:简历获取和存储步骤,获取简历数据并将简历数据存储到简历库中;索引生成和存储步骤,基于所述简历数据生成索引并以分布式方式存储所述索引;搜索步骤,基于接收到的检索关键词在所述索引中进行搜索,并返回搜索结果。
进一步地,基于所述简历数据生成索引并以分布式方式存储所述索引包括:创建索引,所述索引包括多个索引分片,所述多个索引分片被分配至集群的N个节点进行存储,其中N为大于1的正整数;基于每条简历数据生成该条简历数据的索引文档,并将所述索引文档存入相应的索引分片;在全部索引文档存储完毕后,为每个索引分片复制至少一个分片副本,并将分片副本存储到集群的相应节点上,使得每个索引分片与其分片副本存储在不同节点。
进一步地,基于每条简历数据生成该条简历数据的索引文档包括:对该条简历数据进行中文分词;基于分词结果提取分别与简历的各个维度对应的简历关键词;将所提取的简历关键词写入该条简历数据的索引文档的相应字段。
进一步地,中文分词通过IK分词技术实现。
进一步地,在所述搜索步骤中,基于所述检索关键词在集群的各个节点上进行并行搜索。
进一步地,所述N个节点中包括一主节点和N-1个从节点,所述主节点通过选举产生,当所述主节点出现故障时,通过选举在从节点中产生新的主节点。
进一步地,在搜索步骤中,由各从节点将其搜索结果发送至主节点,并由主节点汇总并返回搜索结果。
进一步地,所述简历快速搜索方法进一步包括展示所述搜索结果,其中,所述检索关键词在所述搜索结果中高亮显示。
根据本发明的另一方面,提供一种简历快速搜索系统,所述简历快速搜索系统包括:简历获取和存储装置,其获取简历数据并将简历数据存储到简历库中;索引生成和存储装置,其基于所述简历数据生成索引并以分布式方式存储所述索引;搜索装置,其基于接收到的检索关键词在所述索引中进行搜索,并返回搜索结果。
根据本发明的再一方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序能够被一个或者多个处理器执行,以实现上述的简历快速搜索方法。
本发明能够实现简历快速搜索,在保证搜索准确性的前提下,提高简历搜索速度。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于毕昀,未经毕昀许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910342733.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:跨链存储方法、终端及存储介质
- 下一篇:基于知识库的内容管理方法及装置