[发明专利]人才推荐方法和装置有效

专利信息
申请号: 201710497014.2 申请日: 2017-06-26
公开(公告)号: CN107315807B 公开(公告)日: 2020-08-04
发明(设计)人: 李微;王泽华;吴志成;张健;徐衔;郭晓茹 申请(专利权)人: 三螺旋大数据科技(昆山)有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/9535
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 苏胜
地址: 215300 江苏省苏州市昆山*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人才 推荐 方法 装置
【说明书】:

发明提供了一种人才推荐方法和装置;其中,该方法包括从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;根据文本数据的发布时间,对文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将热门主题对应的文本数据的作者作为人才进行推荐。本发明可以灵活准确地获取每个时间段内的主题以及当前的热门主题,避免了人为设置主题个数造成的提取出的主题冗余度大或主题遗漏的问题,进而提高了根据热门主题推荐人才的准确性和灵活性。

技术领域

本发明涉及数据检索技术领域,尤其是涉及一种人才推荐方法和装置。

背景技术

为了获取主题随着时间的演化规律,现有技术中通常通过如下三种方法:一是将时间信息结合到LDA模型,在LDA模型中引入时间因素,使得每个主题增添了一个时间属性,进而表达主题在不同时间的分布情况;二是首先使用LDA获取主题,再检索并量化主题在时间上的分布情况;三是先将文本离散到与之对应的时间窗上,再根据每个时间窗上的文本集合进行主题提取。

上述三种方法均属于简单主题演化,采用上述方法进行主题演化时,易造成不同时间窗主题个数固定的问题,进而导致根据热门主题进行人才推荐的方式灵活度和准确度较低。

针对上述人才推荐的方式灵活度和准确度较低的问题,尚未提出有效的解决方案。

发明内容

有鉴于此,本发明的目的在于提供一种人才推荐方法和装置,以提高根据热门主题推荐人才的准确性和灵活性。

第一方面,本发明实施例提供了一种人才推荐方法,包括:从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;根据文本数据的发布时间,对文本数据进行分类;采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;根据处理结果,获取当前时间段的热门主题;将热门主题对应的文本数据的作者作为人才进行推荐。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述根据文本数据的发布时间,对文本数据进行分类的步骤,包括:提取文本数据的发布时间;将发布时间分别与预先设置的多个时间段进行匹配;根据匹配结果确定文本数据所属的时间段。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,上述采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理的步骤,包括:逐一获取每个时间段对应的文本数据;采用分层狄利克雷过程的方式,对每个时间段对应的文本数据进行主题提取处理,生成每个时间段对应的主题。

结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述根据处理结果,获取当前时间段对应的热门主题的步骤,包括:计算各个时间段内主题的出现频率,生成主题的演变规律;其中,演变规律为主题的出现频率与各个时间段的对应关系;根据主题的演变规律,确定当前时间段对应的热门主题。

结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述将热门主题对应的文本数据的作者作为人才进行推荐的步骤,包括:获取热门主题对应的文本数据的作者;按照预设的排序条件,对作者进行排序;其中,预设的排序条件至少包括同一作者的文本数据的数量和文本数据的权重值中的一种;将排序结果满足预设阈值的作者作为人才进行推荐。

第二方面,本发明实施例提供了一种人才推荐装置,包括:数据获取模块,用于从预设的数据库中获取文本数据;其中,文本数据至少包括文章、论文和网页文本中的一种;分类模块,用于根据文本数据的发布时间,对文本数据进行分类;主题提取模块,用于采用分层狄利克雷过程的方式,对每个类型对应的文本数据进行主题提取处理;主题获取模块,用于根据处理结果,获取每个类型对应的热门主题;人才推荐模块,用于将热门主题对应的文本数据的作者作为人才进行推荐。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三螺旋大数据科技(昆山)有限公司,未经三螺旋大数据科技(昆山)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710497014.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top