[发明专利]一种面向技术领域的专业人才搜索方法有效
申请号: | 201810544758.X | 申请日: | 2018-05-31 |
公开(公告)号: | CN108763520B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 徐小良;顾高飞 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/30 | 分类号: | G06F16/30;G06Q10/06 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向技术领域的专业人才搜索方法。本发明首先对海量科技成果数据资源进行文本处理和知识挖掘,生成技术领域词库和对应的词向量库。然后构建人才‑技术领域专业能力模型:对科技成果所属技术领域进行智能化标注并生成人才与技术领域的关系;综合科技成果的质量评分、人才贡献度、技术领域偏重度,构建人才‑技术领域专业能力模型。最后根据步骤2中的人才‑技术领域专业能力模型,计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现面向技术领域的专业人才搜索引擎。本发明基于大数据实现人才‑技术领域专业能力评分的智能计算,面向技术领域进行人才搜索比较便捷高效,排序结果比较科学合理。 | ||
搜索关键词: | 一种 面向 技术 领域 专业人才 搜索 方法 | ||
【主权项】:
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:步骤1:生成技术领域词库和词向量库利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。;步骤2:构建人才‑技术领域专业能力模型步骤2.1:生成人才‑技术领域关系通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;步骤2.2:计算科技成果的质量评分Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:Spaper=log(k·dc+10)·grade(dr)Spatent=patentType(da)Sproject=fund(db)·projectType(de)其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值;步骤2.3:计算科技成果的人才贡献度科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:
其中,m表示人才在该科技成果中的排名,即第几成员,1≤m≤4,排名靠后的成员;步骤2.4:计算科技成果的技术领域偏重度使用相关技术领域词向量的加权平均来表示科技成果的主题向量,该主题向量与技术领域词向量的归一化余弦相似度,即为该科技成果的技术领域偏重度;![]()
为科技成果k的主题向量,设tki为科技成果k中的第i个技术领域词,aki为对应的词向量,tki∈T,aki∈A,xki为tki在科技成果k中出现的词频,n表示科技成果k中包含的技术领域词总数量,xk为上式中的xki之和;
Wki表示科技成果k对于tki的技术领域偏重度,通过计算词向量aki与主题向量
的归一化余弦相似度得到;将tki用tf表示,tf∈T,tf表示T中第f个技术领域词,则对应的aki可以表示为af,Wki表示为W′kf,则得到下式
步骤2.5:构建人才‑技术领域专业能力模型将科技成果的质量评分、人才贡献度和技术领域偏重度三者相乘,计算得到人才就参与该科技成果的技术领域专业能力分值;人才‑技术领域专业能力是该人才所参与的各相关科技成果的技术领域专业能力分值之和,人才‑技术领域专业能力模型如下:
其中,Vpf表示人才p对于技术领域tf的专业能力,k代表该人才p参与的第几项科技成果,Sk为科技成果k的质量评分,Cpk为该人才p在科技成果k中的贡献度;科技成果k可以是学术论文、专利或科研项目,Sk可以如下表示如下:
其中,α、β和γ则分别是学术论文、专利或科研项目三种类型科技成果质量权重的调节因子,三者的取值范围为[0,1],其和为1;步骤3:生成索引文件实现搜索引擎根据步骤2中的人才‑技术领域专业能力模型进行计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现搜索引擎;用户在搜索框中输入技术领域词,即可搜索得到该技术领域专业能力从高到低排序的人才列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810544758.X/,转载请声明来源钻瓜专利网。
- 上一篇:阅读的推荐方法、装置及可读存储介质
- 下一篇:存储歌词注音的方法和装置