[发明专利]一种基于兴趣演化的学者合作关系预测方法有效
申请号: | 202010096509.6 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111325390B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 蔡世民;李健强;王锐杰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/101;G06F16/31;G06F16/38;G06F16/383 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 兴趣 演化 学者 合作关系 预测 方法 | ||
1.一种基于兴趣演化的学者合作关系预测方法,该方法包括:
步骤1:数据采集;
对所需的学者和论文数据进行采集并存储,采集内容包括:学者名、背景机构、研究领域、所著论文列表,论文标题、论文作者列表、论文关键词、论文发表期刊或会议、论文发表时间、引用量;
步骤2:数据预处理;
对步骤1存储的数据进行融合,通过所著论文列表将学者名和该学者所著论文对应起来,对于重名问题,则要结合学者名,背景机构进行联合筛选,在最后要对于每一名学者的论文全数据集的论文关键词进行词频统计,并选取出排名前N个论文关键词;
步骤3:统计步骤2得到的各学者排名前N个论文关键词对应的论文发表时间,根据不同时间所发表的论文对应的关键词作为该学者当时的研究兴趣或研究方向,将此兴趣方向输入时间兴趣衰减函数模型从而对学者的兴趣权重进行计算,得到学者基于时间兴趣演化的权重向量;
步骤3.1:按时间线排列学者的论文,以时间线上由远到近的方式排列后,对各发表论文的关键词以论文关键词,论文发表时间的二元关系方式进行标注;
步骤3.2:对于该学者的论文发表时间进行节点刻画,以当下年份为标准值T0,对于其余各年份时间,利用研究兴趣领域随时间的转移或改变,考虑到兴趣随时间的衰减演化,在时间兴趣衰减曲线上进行权重值计算,得到论文关键词,关键词权重值的权重表示关系;
步骤3.3:根据步骤2得到的排名前N个论文关键词和步骤3.2得到的基于时间兴趣演化的关键词权重值,进行学者的时间兴趣维度统计,并将相同关键词的权重值相加,得到学者基于时间兴趣演化的权重向量;
其中基于时间兴趣演化的权重向量计算方法为:
步骤3.3.1:采用如下公式计算关键词的权重信息
其中,m表示关键词的编号,j表示论文的编号,λ表示时间衰减因子,表示关键词的时间信息,为关键词所在论文发表时间与当前时间差值的绝对值;
步骤3.3.2:将对不同时间,不同论文相同关键词的权重相加得到关键词权重Wm;
步骤3.3.3:结合sigmoid函数对关键词权重进行归一化:
归一化后得到学者基于时间兴趣演化的权重向量
步骤4:计算不同学者之间基于时间兴趣演化的向量维度的余弦相似度,在余弦相似度最高的学者之间进行学术合作预测,并输出最后的预测结果;
采用如下公式计算不同学者之间基于时间的兴趣演化权重向量的余弦相似度cosθ:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010096509.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理