[发明专利]一种基于兴趣演化的学者合作关系预测方法有效
申请号: | 202010096509.6 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111325390B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 蔡世民;李健强;王锐杰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/101;G06F16/31;G06F16/38;G06F16/383 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 兴趣 演化 学者 合作关系 预测 方法 | ||
该发明公开了一种基于兴趣演化的学者合作关系预测方法,涉及数据挖掘领域。本发明考虑到传统方法缺陷的影响,并对于各研究兴趣进行基于时间的权重值计算,目的是在于提供一种时序状态下的准确兴趣刻画方法,从而利用相应的兴趣维度匹配进行合作关系预测。本发明所涉及到的相关系统流程包括:数据采集、数据预处理、时间权重计算和合作关系预测;利用数据驱动,利用论文著作的关键词频数进行学者的兴趣识别,再利用论文的时间节点进行学者的兴趣权重区分,参照以上两个因素形成随时间演化的学者研究领域的兴趣程度刻画;除此之外,将以上方法的结果进行科研学者兴趣匹配,再融入到整个合作关系预测方法当中,从而达到精确地匹配。
技术领域
本发明涉及数据挖掘领域,尤其涉及到基于兴趣演化的科研学者研究兴趣匹配和合作关系预测的方法及系统。
背景技术
在进入互联网时代之后,学者之间的合作通过网络的联系变得更加频繁和紧密。在社交工具发达、信息传播速度倍增的背景下,学术合作的前景已经不再只局限于在小范围的学术交流圈或是同一学术机构内产生,愈来愈多的学术合作将发生在陌生学者之间,突破国别和地域限制,通过相似的研究方向和兴趣进行匹配,使得学术合作的可能性大大增加。
随着时间的推移,科研学者的研究方向会逐渐在各种因素的影响下发生调整,在整个学术生涯中可能会分阶段专攻不同方向,这些因素包括领域的相关研究热度、个人的学术突破或外部环境影响。因此,在通过充分的数据补全和分析后,合理的对目标学者的整个学术生涯由远到近进行基于兴趣演化的学者研究领域权重计算,是合理准确推导出目标学者学术研究领域维度的重要支撑。
在充分考虑了时间节点对于研究兴趣和研究领域的权重影响后,利用权重值计算出相关的兴趣维度,对该结果进行匹配,由此为学者合作关系的预测提供依据。本发明提供了一种基于兴趣演化的学者合作关系预测方法及系统。
对于传统的学者合作关系预测方法,有如下缺点:
1、将预测依据的重心大多都放在了学者之间的合作拓扑关系上,依据拓扑结构进行同构或异构链路预测,此类方法可靠度较高但会局限于在局部网络中进行目标选择,无法突破时空限制,且并未考虑到因为兴趣相投产生具体合作的情况,在互联网信息蓬勃发展的时代,显示是具有一定的局限性。
2、在目标的研究领域,没有充分考虑整个学术职业生涯的兴趣迁移或改变情况(即是兴趣演化特征),可能在生涯的早中晚期都会进行不同方面的研究,并且侧重某个领域。故没有充分利用兴趣演化的时间函数进行权重计算,准确的描绘出兴趣迁移或改变所带来的差异性。
发明内容
本发明提供了一种基于兴趣演化的学者合作关系预测方法及系统。学者合作关系的预测在传统方法上主要来源于链路预测等拓扑结构方法,对于不在结构和社区中的节点则无法适用(即是冷启动问题)。本发明考虑到传统方法缺陷的影响,提供一种基于研究兴趣匹配的合作关系预测方法,并对于各研究兴趣进行基于时间的权重值计算,目的是在于提供一种时序状态下的准确兴趣刻画方法,从而利用相应的兴趣维度匹配进行合作关系预测。
为了完成以上所述内容,本发明所涉及到的相关系统流程包括:数据采集、数据预处理、时间权重计算和合作关系预测。本发明利用数据驱动,利用论文著作的关键词频数进行学者的兴趣识别,再利用论文的时间节点进行学者的兴趣权重区分,参照以上两个因素形成随时间演化的学者研究领域的兴趣程度刻画。除此之外,将以上方法的结果进行科研学者兴趣匹配,再融入到整个合作关系预测方法当中。
因此本发明技术方案为一种基于兴趣演化的学者合作关系预测方法,该方法包括:
步骤1:数据采集;
对所需的学者和论文数据进行采集并存储,采集内容包括:学者名、背景机构、研究领域、所著论文列表,论文标题、论文作者列表、论文关键词、论文发表期刊或会议、论文发表时间、引用量;
步骤2:数据预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010096509.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理