[发明专利]一种基于多源信息融合技术的专家推荐方法有效
申请号: | 202010964492.1 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112269909B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 朱全银;方强强;李翔;马甲林;张柯文;王文川;胥心心;王胜标;丁行硕;成洁怡 | 申请(专利权)人: | 淮阴工学院 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F40/216;G06F40/258;G06F40/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 融合 技术 专家 推荐 方法 | ||
1.一种基于多源信息融合技术的专家推荐方法,其特征在于,具体步骤如下:
(1)爬取技术专家数据构建知识库,并构建关键词词典keywords;
(2)抽取知识库作者字段进行词频共现分析构建专家合作关系子网;
(3)分别使用正则表达式和命名实体识别算法抽取Web页面专家研究方向与个人信息构建专家Web子网;
(4)分别通过lda算法对知识库摘要字段提取文档-主题和主题-关键词,TF-IDF算法提取摘要字段权重最大的5个词,共同构建主题子网;
(5)以专家姓名-机构为约束条件结合三种子网构建并计算专家信息网络中专家中心度值,对专家中心度值排序并推荐排名前5的专家作为推荐结果。
2.根据权利要求1所述的一种基于多源信息融合技术的专家推荐方法,其特征在于,所述步骤(1)中构建关键词词典keywords的具体步骤如下:
(1.1)从知识库中获取科技论文文献W,W篇幅总数为M,并创建一个空关键词词典keywords;
(1.2)定义全局循环变量Vi初始化为1用于遍历W,Vi∈(1,M),其中,WVi表示第Vi篇文献;
(1.3)判断Vi≤M是否成立,若成立,执行步骤(1.4),若不成立,执行步骤(1.11);
(1.4)定义循环变量Vij初始化为1为文献WVij的第j个关键词,Vij∈(1,N),N为文献WVij的关键词个数;
(1.5)判断Vij∈keywords是否成立,若成立,执行步骤(1.6),若不成立,执行步骤(1.10);
(1.6)关键词表中已存在关键词Vij,放弃写入Vij;
(1.7)令Vij=Vij+1;
(1.8)判断Vij≤N是否成立,若成立,执行步骤(1.5),若不成立,执行步骤(1.9);
(1.9)令Vi=Vi+1,并执行步骤(1.3);
(1.10)将关键词Vij写入关键词表keywords,并执行步骤(1.7);
(1.11)得到包含所有关键词的关键词表keywords。
3.根据权利要求1所述的一种基于多源信息融合技术的专家推荐方法,其特征在于,所述步骤(2)中抽取知识库作者字段进行词频共现分析构建专家合作关系子网的具体步骤如下:
(2.1)从知识库中获取科技论文文献W,W篇幅总数为M,全局循环变量Vi和第Vi篇文献WVi;
(2.2)判断Vi≤M是否成立,若成立,执行步骤(2.3),若不成立,执行步骤(2.5);
(2.3)对第WVi篇科技论文作者进行分隔,得到文献作者关系R={WVi,WVia},其中,WVia为第WVi篇文献的第a位作者姓名;
(2.4)令Vi=Vi+1并执行步骤(2.2);
(2.5)得到分隔后的所有文献作者关系R;
(2.6)对文献作者关系R中所有作者做频次统计,得到作者频次A={m,Na},其中,Na为作者姓名,m为Na出现总次数;
(2.7)统计作者共现频次G={n,Nap Naq},其中,G表示作者Nap与Naq共同出现n次;
(2.8)将作者共现频次G转化为共现网络得到作者关系子网。
4.根据权利要求1所述的一种基于多源信息融合技术的专家推荐方法,其特征在于,所述步骤(3)分别使用正则表达式和命名实体识别算法抽取Web页面专家研究方向与个人信息构建专家Web子网的具体步骤如下:
(3.1)知识库中获取专家Web页面信息;
(3.2)通过命名实体识别算法对专家Web页面进行专家信息获取;
(3.3)得到专家个人信息;
(3.4)定义正则表达式规则Ru;
(3.5)判断规则Ru在Web页面取值是否为空,若成立,执行步骤(3.8),若不成立,执行步骤(3.6);
(3.6)得到专家研究方向;
(3.7)得到专家研究方向和专家个人信息并构建Web子网;
(3.8)得到专家个人信息并构建Web子网。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010964492.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置