[发明专利]学术社交网络科研合作者推荐方法在审
申请号: | 201711092851.3 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107833142A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 李先贤;郭亚萌;王利娥;刘鹏 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06N99/00 |
代理公司: | 桂林市持衡专利商标事务所有限公司45107 | 代理人: | 陈跃琳 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学术 社交 网络 科研 合作者 推荐 方法 | ||
技术领域
本发明涉及社交网络技术领域,具体涉及一种学术社交网络科研合作者推荐方法。
背景技术
一个社交网络(Social Network)可以被抽象地描述为许多节点组成的图,节点间的边代表他们之间的联系,如微博中的粉丝关系。学术社交网络(Academic Social Network)是社交网络的一种,其中节点代表学术科研者,节点之间的边代表其具有合作关系。根据科研者对学术大数据进行分析后发现,学术论文最近几年呈多产趋势,其中很大一部分原因是因为科研者更偏向于以合作的方式来发表论文,比如机构与机构,学校与学校,或者科研者与科研者之间。因此,对学术合作者进行推荐的需求得到了科研者很大的重视。学术社交网络科研合作者推荐可以给科研者提供的帮助往往不止是论文而已,而是领域内最前沿的学术进展与方向。尤其是在学术大数据的背景下,数据的增长远远超过人们的想象,而如何在成千上万的数据中让用户得到有利的数据正是推荐系统存在的意义。
面向学术社交网络科研合作者推荐指的是链接预测和链接推荐,即找到潜在的链接并推荐给目标用户。而如何准确的推荐有益的合作者给目标用户成为了数据分析领域的主要研究问题。在现有的推荐方法中,大多数的研究主要针对节点(研究者)之间的关系进行链路预测,大致分为以下三种:
(1)基于图结构的链路预测算法,通过计算节点间的相似度来进行推荐,相似度本身具有很多不同的定义,有简单的方法也有一些基于复杂的数学模型方法,比如:1.通过共同邻居的个数来计算相似性;2.基于随机游走的平均通讯时间或者平均步数相似度计算方法;3.基于图论的矩阵森林方法。
(2)基于数据挖掘分类算法的链路预测算法,数据挖掘领域有很多分类算法,很多的研究者利用这些分类方法进行链路预测,即一类基于数据挖掘领域里分类算法的链路预测算法。在已知的社交网络图中,根据链接关系提取节点或者相连边的特征,根据这些属性,选择合适的分类方法对节点属性进行分类,再根据类属关系进行链路预测。
(3)基于网络建模概率模型的链路预测算法,这种方法会利用整个社交网络的节点和边的信息构造一个统计模型,然后基于此进行链路预测。
然而,上述现有面向学术社交网络合作者的推荐方法主要还是基于考虑合作者之间的关联,采用基于马尔科夫链的随机游走模型对学术社交合作图进行链路预测。但是只考虑了彼此之间的关系,比如合作的次数,最近的合作时间等,没有考虑到科研者本身的一些属性,比如身份属性这是动态的随时间变化的一种属性。如果推荐系统给一个科研者推荐一个合作者,这个合作者的学术水平很高,而且研究领域也和目标科研者十分相似,但是他可能今后不再从事科研工作的话,那么这个推荐是无效的。
发明内容
本发明所要解决的是现有面向学术社交网络的合作者推荐方法存在只考虑合作者之间的关联而导致无效推荐的问题,提供一种学术社交网络科研合作者推荐方法。
为解决上述问题,本发明是通过以下技术方案实现的:
学术社交网络科研合作者推荐方法,包括步骤如下:
步骤1.构建学术合作图,即先将学术社交网络中的每个科研者用节点来表示,再根据学术论文中的作者即科研者的合作关系用边来表示,从而获得学术合作图;
步骤2.在学术合作图中,根据学术数据统计的科研者自身属性信息,采用机器学习中决策树模型,以是否予以推荐作为各个节点的标签属性;
步骤3.采用马尔科夫链的随机游走算法来计算学术合作图中节点间的相似度,从而得到学术合作图中节点与节点之间的转移概率矩阵;
步骤4.计算学术合作图中各个节点的活跃度,其中节点x的活跃度ACTx为:
其中,θx表示节点x的活跃因子,表示从第i年到第j年节点x所发论文的数量,表示从第i年到第j年节点x发表论文的总年数,表示从第i年到第j年节点x不发表论文的总年数,i表示设定的起始年份,j表示设定的截至年份;
步骤5.计算学术合作图中各个节点的学术水平,其中节点x的学术水平ACLx为:
其中,αk表示设定的论文等级k的等级因子,nk表示节点x所发表的论文等级为k的论文数量,k表示论文等级,L为论文等级集合,表示从第i年到第j年,i表示设定的起始年份,j表示设定的截至年份;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711092851.3/2.html,转载请声明来源钻瓜专利网。