[发明专利]一种基于链接分析的引文推荐方法及系统有效
申请号: | 202010556832.7 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111460324B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 冯雅;吴宗羲 | 申请(专利权)人: | 杭州灿八科技有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 贺龙萍 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 链接 分析 引文 推荐 方法 系统 | ||
1.一种基于链接分析的引文推荐方法,其特征在于,包括步骤:
S1、基于论文间的引用关系、作者相似性、内容相似性构建有向加权引用网络;
S2、将所述有向加权引用网络划分为多个网络集群;
S3、为每个所述网络集群选择影响力最大的节点作为代表节点;
S4、基于作者相似性、内容相似性为新建论文选择相应的网络集群,作为候选网络集群;
S5、将所述候选网络集群中与新建论文相似度最高的节点作为第一节点加入候选引文推荐集,计算所述第一节点与所述候选网络集群中其它节点间的链接度;
S6、选择与所述第一节点的链接度高于第二阈值的节点加入所述候选引文推荐集;将选择的节点作为第一节点继续选择节点加入候选引文推荐集直到不能满足第二阈值的要求或网络集群中的所有节点都已加入候选引文推荐集;
S7、获取第一时间段内发表的论文作为第一论文,预测未来第二时间段内第一论文的引用次数;
S8、获取第三时间段内发表的论文作为第二论文,第三时间段=第一时间段+第二时间段;计算所述第一论文、第二论文的引用次数增长度;
S9、将所述引用次数增长度大于第四阈值的论文加入所述候选引文推荐集得到最终引文推荐集,向用户推荐最终引文推荐集中的论文作为新建论文的引文;
具有引用关系的论文的所述作者相似性为:
其中,、分别为作者相同、作者合作所占的权重,;为论文具有的相同作者个数,为论文中具有合作关系的作者对数,为第对具有合作关系的作者合作完成的论文数;
具有引用关系的论文、的所述内容相似性为:
其中,为论文第维的值, 为论文o第维的值,为论文向量的维度;
具有引用关系的论文的相似性为:
其中,为作者相似性的权重;
所述有向加权引用网络中边的权值为边所连接论文的相似性;
所述S2具体为:
S21、选择有向加权引用网络中节点度数最高的论文节点作为初始节点,设置c=1;
S22、将所述初始节点加入新建立的集群SCc;
S23、获取与SCc中的论文节点连接、且不属于任何已建立的集群的点,加入候选集群;若候选集群为空集,执行步骤S25;
S24、判断候选集群中与集群SCc中论文节点的连接边的最大权值是否大于第一阈值,若是,选择最大权值对应的论文节点及连接边加入集群SCc,继续执行步骤S23;若否,c=c+1,执行步骤S25;
S25、判断有向加权引用网络中是否存在不属于任何集群的论文节点,若是,选择不属于任何集群的度数最高的论文节点作为初始节点,执行步骤S22,若否,输出集群SC1、SC2、...、SCc、...、SCx,其中,x为网络集群的个数;
节点f的所述影响力为:
其中,网络集群中引用节点f的节点个数,为第j个引用节点f的节点在网络集群中被引用的次数,,为引用第j个引用节点f的节点中同时引用节点f的节点个数;
以所述第一节点为起点,起点与候选引文推荐集中邻居节点
其中,为邻居节点
2.根据权利要求1所述的引文推荐方法,其特征在于,所述S4包括:选择与新建论文的相似性最大的网络集群作为候选网络集群;新建论文与网络集群SCc的相似性为:
其中,M为SCc中论文节点的数量,为新建论文与第q个论文节点间的相似性,。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州灿八科技有限公司,未经杭州灿八科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010556832.7/1.html,转载请声明来源钻瓜专利网。