[发明专利]人才推荐方法和装置有效
申请号: | 201710497014.2 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107315807B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 李微;王泽华;吴志成;张健;徐衔;郭晓茹 | 申请(专利权)人: | 三螺旋大数据科技(昆山)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 215300 江苏省苏州市昆山*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人才 推荐 方法 装置 | ||
本发明提供了一种人才推荐方法和装置;其中,该方法包括从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;根据文本数据的发布时间,对文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将热门主题对应的文本数据的作者作为人才进行推荐。本发明可以灵活准确地获取每个时间段内的主题以及当前的热门主题,避免了人为设置主题个数造成的提取出的主题冗余度大或主题遗漏的问题,进而提高了根据热门主题推荐人才的准确性和灵活性。
技术领域
本发明涉及数据检索技术领域,尤其是涉及一种人才推荐方法和装置。
背景技术
为了获取主题随着时间的演化规律,现有技术中通常通过如下三种方法:一是将时间信息结合到LDA模型,在LDA模型中引入时间因素,使得每个主题增添了一个时间属性,进而表达主题在不同时间的分布情况;二是首先使用LDA获取主题,再检索并量化主题在时间上的分布情况;三是先将文本离散到与之对应的时间窗上,再根据每个时间窗上的文本集合进行主题提取。
上述三种方法均属于简单主题演化,采用上述方法进行主题演化时,易造成不同时间窗主题个数固定的问题,进而导致根据热门主题进行人才推荐的方式灵活度和准确度较低。
针对上述人才推荐的方式灵活度和准确度较低的问题,尚未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种人才推荐方法和装置,以提高根据热门主题推荐人才的准确性和灵活性。
第一方面,本发明实施例提供了一种人才推荐方法,包括:从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;根据文本数据的发布时间,对文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将热门主题对应的文本数据的作者作为人才进行推荐。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述根据文本数据的发布时间,对文本数据进行分类的步骤,包括:提取文本数据的发布时间;将发布时间分别与预先设置的多个时间段进行匹配;根据匹配结果确定文本数据所属的时间段。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,上述采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理的步骤,包括:逐一获取每个时间段对应的文本数据;采用分层狄利克雷过程的方式,对每个时间段对应的文本数据进行主题提取处理,生成每个时间段对应的主题。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述根据处理结果,获取当前时间段对应的热门主题的步骤,包括:计算各个时间段内主题的出现频率,生成主题的演变规律;其中,演变规律为主题的出现频率与各个时间段的对应关系;根据主题的演变规律,确定当前时间段对应的热门主题。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述将热门主题对应的文本数据的作者作为人才进行推荐的步骤,包括:获取热门主题对应的文本数据的作者;按照预设的排序条件,对作者进行排序;其中,预设的排序条件至少包括同一作者的文本数据的数量和文本数据的权重值中的一种;将排序结果满足预设阈值的作者作为人才进行推荐。
第二方面,本发明实施例提供了一种人才推荐装置,包括:数据获取模块,用于从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;分类模块,用于根据文本数据的发布时间,对文本数据进行分类;主题提取模块,用于采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;主题获取模块,用于根据处理结果,获取每个类型对应的热门主题;人才推荐模块,用于将热门主题对应的文本数据的作者作为人才进行推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三螺旋大数据科技(昆山)有限公司,未经三螺旋大数据科技(昆山)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710497014.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于文件系统的嵌入式存储方法和装置
- 下一篇:一种Web查询框架