[发明专利]科技文献异构网络中节点的学术影响力协同排序方法有效

专利信息
申请号: 201410292725.2 申请日: 2014-06-25
公开(公告)号: CN104133843B 公开(公告)日: 2017-07-04
发明(设计)人: 余春艳;吴志强;叶东毅;何振峰 申请(专利权)人: 福州大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 福州元创专利商标代理有限公司35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 科技 文献 网络 节点 学术 影响力 协同 排序 方法
【说明书】:

技术领域

发明提供了一种科技文献异构网络中节点(论文、作者、期刊/会议)的学术影响力协同排序方法,属于信息检索领域。

背景技术

科技文献网络通常包含三种不同类型的学术节点:作者、论文和期刊/会议,不同类型学术节点之间还具有不同关系的连接边,比如:作者-论文间撰写和被撰写关系、论文-论文间的引用和被引用关系、会议-论文间的发表和被发表关系、作者-作者间的合作和引用等关系。

一般情况下,一个信息网络可以用一个有向图G=(V,E)以及节点类型函数τ:V→A和连接边类型函数φ:E→R加以表征。其中,每个节点v∈V的节点类型τ(v)∈A;每条边e∈E的边类型φ(e)∈R。当|A|>1或者|R|>1时,该网络为异构型信息网络,否则为同构型信息网络,因此科技文献网络是一种典型异构信息网络。

异构信息网络的节点影响力排序方法主要分成同构方式和异构方式的方法,同构方式抽取一种类型节点生成同构网络,然后计算该类型节点的影响力并排序;异构方式同时考虑多种类型节点生成异构网络,然后计算多种类型节点的影响力并排序。同样对科技文献网络中的学术节点的排序方法也存在着两种方式,目前为止,对科技文献网络的现有排序方法包括:

1.提取科技文献网络中一种节点生成同构网络,然后应用pagerank算法对该种类型的节点进行排序。Bol了n J,Rodriquez M A等人应用pagerank于期刊-期刊引用网络中,对期刊进行排序;Ding Y应用pagerank于作者-作者引用网络中,对作者进行排序;Ma N,Guan J等人应用pagerank于论文-论文引用网络中,对论文进行排序,这些方法无法利用文献网络中的所有语义信息,并只对一种类型的节点排序。

2.将科技文献网络看成异构网络,对科技文献网络中三种类型的节点同时进行排序,Deng,Z.H,Lai B Y等人提出PAV模型对三种类型的节点同时进行排序,此方法中的文献网络包括了间接关系作者-作者合作关系,可以由作者-论文的撰写关系和被撰写关系复合而成,不足在于其在处理网络异构性的方法仅仅是对不同类型的边定义不同的权重,但是此权重在定义时潜意识地是比较同类型边的之间的关系强弱,并没有很好处理不同类型边之间的关系,并且会出现节点影响力与入度相关的现象,即发表论文数量越多的作者和期刊会排的越靠前面。

发明内容

本发明针对目前科研文献网络排序方法存在的问题,提出了科技文献异构网络中节点(论文、作者、期刊/会议)的学术影响力协同排序方法。

本发明的具体技术方案如下:

一种科技文献异构网络中节点的学术影响力协同排序方法,其特征在于:步骤包括如下:

A.获取科技文献异构网络,抽取出科技文献异构网络的极小网络模式;

B.在科技文献异构网络中计算各条边权重以配置节点网络拓扑驱动下的随机游走;

C.根据科技文献异构网络的最小网络模式,统计不同领域的各种关系边的平均边介数,计算传播因子并配置节点学术类型驱动下的随机游走;

D.结合节点的网络拓扑驱动下的随机游走和学术类型驱动下的随机游走的两级随机游走计算科技文献异构网络中的论文、作者、期刊/会议三种不同类型的学术节点的影响力排序。

在本发明一实施例中,步骤A中,文献网络的网络模式中,节点对应文献网络的三种学术对象,分别为作者、论文、期刊/会议、边代表学术对象之间的关系;学术对象之间可能的关系包括:作者-论文间撰写和被撰写关系、论文-论文间的引用和被引用关系、会议-论文间的发表和被发表关系、作者-作者间的合作和引用关系;上述关系可以划分为直接关系和间接关系,直接关系为语义上无法由其它关系复合而成的关系,间接关系为语义上可以由直接关系复合而成的关系;文献网络的极小网络模式是一个极小化网络元模板,仅保留学术对象间的直接关系,去掉其中的间接关系,包括5种直接关系:作者-论文间撰写和被撰写关系、论文间的引用关系、会议-论文间的发表和被发表关系。

在本发明一实施例中,步骤B中,基于科技文献异构网络设计其中学术节点在网络拓扑驱动下的随机游走行为,并配置各权重量化计算,具体计算如下:

1)撰写关系边的权重计算公式:其中Cp,a表示作者a对论文p的贡献,计算公式为Sp,a表示作者a是论文p的第几作者,P(a)是作者a的所有撰写的论文集合,A(p)是论文p的作者列表;

2)被撰写关系边的权重计算公式:Hinp是论文在引用关系中的入度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410292725.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top