[发明专利]科技文献异构网络中节点的学术影响力协同排序方法有效
申请号: | 201410292725.2 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104133843B | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 余春艳;吴志强;叶东毅;何振峰 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科技 文献 网络 节点 学术 影响力 协同 排序 方法 | ||
1.一种科技文献异构网络中节点的学术影响力协同排序方法,其特征在于:步骤包括如下:
A.获取科技文献异构网络,抽取出科技文献异构网络的极小网络模式;
B.在科技文献异构网络中计算各条边权重以配置节点网络拓扑驱动下的随机游走;
C.根据科技文献异构网络的最小网络模式,统计不同领域的各种关系边的平均边介数,计算传播因子并配置节点学术类型驱动下的随机游走;
D.结合节点的网络拓扑驱动下的随机游走和学术类型驱动下的随机游走的两级随机游走计算科技文献异构网络中的论文、作者、期刊/会议三种不同类型的学术节点的影响力排序;
步骤C中,基于科技文献异构网络的极小网络模式设计学术节点的学术类型驱动的随机游走行为,并配置科技文献异构网络的极小网络模式中五种不同类型边的传播因子PF量化,PF包括λpa,λpp,λpv,λap,λvp,分别代表被撰写关系、引用关系、发表关系、撰写关系、被发表关系上的传播因子,PF的设置方法如下:
C1.获取n个领域的强连通图,n>3;
C2.统计n个领域强连通图中被撰写关系边、引用关系边、被发表关系边的平均边介数,并得到相近的λpa:λpp:λpv比值,取n组比值的平均值为这三个传播因子的比值;
C3.最后根据λpa+λpp+λpv=1算出三个传播因子,而λap=1λvp=1。
2.根据权利要求1所述的科技文献异构网络中节点的学术影响力协同排序方法,其特征在于:步骤A中,文献网络的网络模式中,节点对应文献网络的三种学术对象,分别为作者、论文、期刊/会议、边代表学术对象之间的关系;学术对象之间可能的关系包括:作者-论文间撰写和被撰写关系、论文-论文间的引用和被引用关系、会议-论文间的发表和被发表关系、作者-作者间的合作和引用关系;上述关系可以划分为直接关系和间接关系,直接关系为语义上无法由其它关系复合而成的关系,间接关系为语义上可以由直接关系复合而成的关系;文献网络的极小网络模式是一个极小化网络元模板,仅保留学术对象间的直接关系,去掉其中的间接关系,包括5种直接关系:作者-论文间撰写和被撰写关系、论文间的引用关系、会议-论文间的发表和被发表关系。
3.根据权利要求1所述的科技文献异构网络中节点的学术影响力协同排序方法,其特征在于:步骤B中,基于科技文献异构网络设计其中学术节点在网络拓扑驱动下的随机游走行为,并配置各权重量化计算,具体计算如下:
1)撰写关系边的权重计算公式:其中Cp,a表示作者a对论文p的贡献,计算公式为Sp,a表示作者a是论文p的第几作者,P(a)是作者a的所有撰写的论文集合,A(p)是论文p的作者列表;
2)被撰写关系边的权重计算公式:Hinp是论文在引用关系中的入度;
3)引用关系边的权重计算公式:其中Num(p1,P)是论文p1在引用关系中的出度;
4)被发表关系边的权重计算公式:其中P(v)是期刊/会议v发表的论文列表;
5)发表关系边的权重计算公式:其中Num(v,P)是期刊/会议v在发表关系中的出度。
4.根据权利要求1所述的科技文献异构网络中节点的学术影响力协同排序方法,其特征在于:步骤D中,结合节点的网络拓扑驱动下的随机游走和学术类型驱动下的随机游走的两级随机游走计算科技文献异构网络中的作者、论文、期刊/会议三种不同类型的学术节点的影响力排序,按照以下方法实现:
D1.定义从学术节点i到学术节点j的转移概率为:其中TPM是转移概率矩阵,TPMi,j为TPM的第i行第j列的转移概率,TPMlevel为网络拓扑驱动下和学术类型驱动下随机游走行为合成转移概率,TPMlevel(i,j)为TPMlevel第i行第j列的转移概率,计算公式为ε是全图随机跳转的概率,λtypei,typej是i节点类型到j节点类型的传播因子,wi,j是节点i到节点j边的权重,N是整张网络节点总个数,计算得到TPMlevel;
D2.设定两个长度为N的向量Vec_C,Vec_R,Vec_R中的值为文献网络中每个节点的影响力值,Vec_C初始为通过公式计算Vec_R;
D3.通过以下两个公式计算Vec_C和Vec_R
Vec_C=Vec_R
当||Vec_R-Vec_C||≥ξ时继续以上两个公式的计算,否则得到Vec_R,ξ为事先设定误差阈值;
D4.分别对Vec_R中作者、论文、期刊/会议的值进行排序,得到作者、论文、期刊/会议排序结果序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410292725.2/1.html,转载请声明来源钻瓜专利网。