[发明专利]一种基于专利的科技人才推荐方法有效

专利信息
申请号: 201710825493.6 申请日: 2017-09-14
公开(公告)号: CN107656920B 公开(公告)日: 2020-12-18
发明(设计)人: 徐小良;吴远超;王宇翔 申请(专利权)人: 杭州电子科技大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06F40/216;G06F16/33;G06Q10/10;G06Q10/06
代理公司: 杭州奥创知识产权代理有限公司 33272 代理人: 王佳健
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 本发明公开了一种基于专利的科技人才推荐方法。该方法包括以下步骤:对专利数据进行预处理,利用科技词对专利文档进行表示;使用词嵌入模型,以词频为权重进行加权平均,对专利文档语义向量化;聚合科技人才的相关专利文档对其科研能力进行表示;将技术需求进行语义向量化,利用余弦相似度计算技术需求与各专利文档之间的相关度,用高斯核函数确定技术需求与各专利文档的计算权重,最后以局部线性加权的方式得到技术需求与科技人才之间的相关度评分;最后,根据相关度评分进行排序,将评分靠前的科技人才作为推荐结果。该方法对科技人才的科研能力和技术需求等实现了语义化表示,同时克服了传统方法中的维度灾难问题。
搜索关键词: 一种 基于 专利 科技人才 推荐 方法
【主权项】:
一种基于专利的科技人才推荐方法,其特征在于该方法包含如下步骤:步骤1:专利数据预处理对所有专利数据,通过数据处理和机器学习的方法,构建出科技词袋T和对应的词嵌入表示E;对每一个科技词ti∈T,都有且只有一个对应的语义向量ei∈E;然后使用此科技词袋,对每一篇专利文档进行中文分词,且只保留出现在科技词袋T中的词,得到专利文档集合D={d1,d2,...di,...,dn},其中di表示某一篇专利文档,该专利文档由一组科技词组成:di={t1i,t2i,...tki,...,tmi}]]>其中,代表文档di的第k个科技词,且是科技词袋T中的某个词;同时对数据进行结构化处理;提取专利发明人作为科技人才,并进行关联,消歧处理,得到科技人才集合P;每一个科技人才pi的专利文档集合用Di表示:Di={d1i,d2i,...,dki,...dni}]]>其中,代表科技人才pi的第k篇专利文档,且是专利文档集合的一个子集;n是该科技人才的专利文档总数;步骤2:专利文档语义向量化对预处理后的专利文档di,遍历其中的每个科技词在词嵌入模型中找出对应的语义向量同时使用词频作为每个语义向量的权重,对查找到的语义向量进行加权平均,最终得到一个同样维度的实数向量,作为该专利文档的向量表示;具体公式如下:vi=1mΣk=1mtf(tki,di)·eki]]>其中vi代表专利文档di的语义向量化表示,是一个低维的实数向量,其维度取决于预训练的词嵌入模型;代表词在文档di中的词频;步骤3:科技人才的科研能力语义表示经过对专利文档的语义向量化,对于某个科技人才pi,其文档集合Di可语义表示为Vi:Vi={v1i,v2i,...,vki,...,vni}]]>其中代表科技人才pi发表的第k篇专利文档的语义向量;步骤4:针对技术需求的科技人才推荐科技人才针对某一技术需求的科研能力的相关度评分,使用局部线性加权的方式进行计算;使用上述相同的语义向量化,将技术需求表示成语义向量u,计算科技人才的每一篇专利文档与技术需求的带权相似度,最后进行求和,得到最终相关度评分;相关度评分可以表示如下:Score(pi,u)=Σk=1nw(vki,u)·sim(vki,u)]]>代表科技人才pi的第k篇专利文档向量对技术需求向量u的权重,此处使用高斯核函数来进行计算;如果文档向量和技术需求向量在空间中越相近,则对评分的贡献越大;反之则贡献越小;计算公式如下:w(vki,u)=exp{-||vki-u||22σ2}]]>其中,σ为调节参数;代表科技人才pi的第k篇专利文档向量对技术需求向量u的相似程度;科技人才pi针对技术需求u的相关度评分公式为:Score(pi,u)=Σk=1nexp{-||vki-u||22σ2}·vki·u||vki||·||u||]]>根据相关度评分从高到低对科技人才进行排序,获取排名靠前的作为推荐结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710825493.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top