[发明专利]基于论文间引用关系的学术大数据分析方法有效

专利信息
申请号: 201610131343.0 申请日: 2016-03-08
公开(公告)号: CN105808729B 公开(公告)日: 2019-08-23
发明(设计)人: 谈兆炜;刘长风;周劲光;杜佳俊;骆铮;毛宇宁;沈嘉明;王彪;傅洛伊;王新兵 申请(专利权)人: 上海交通大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/36
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于论文间引用关系的学术大数据分析方法,包括步骤1:对本地的论文数据集进行相应的分析和处理后在数据库中构建论文引用网络;步骤2:根据论文引用网络中的引用关系构建分析算法,通过该分析算法获得所述论文引用网络中节点的重要性及相互间的关系,并获得论文相对于中心论文的重要度;步骤3:将论文一对一的引用关系转化为引用方向的映射集和被引用方向的映射集,在所述论文引用网络中通过提取算法获得指定论文间的发展路径,并按照步骤2中获得的论文重要度来计算路径的重要度。本发明中的方法能够便捷地分析出数据库中论文的引用关系,并得到论文间的发展路径,提高了论文检索的精度。
搜索关键词: 基于 论文 引用 关系 学术 数据 分析 方法
【主权项】:
1.一种基于论文间引用关系的学术大数据分析方法,其特征在于,包括如下步骤:步骤1:对本地的论文数据集进行相应的分析和处理后在数据库中构建论文引用网络;步骤2:根据论文引用网络中的引用关系构建分析算法,通过该分析算法获得所述论文引用网络中节点的重要性及相互间的关系,并获得论文相对于中心论文的重要度;所述中心论文是指:用户通过输入进行查询的某一篇论文;步骤3:将论文一对一的引用关系转化为引用方向的映射集和被引用方向的映射集,在所述论文引用网络中获得指定论文间的发展路径,并按照步骤2中获得的论文重要度来计算路径的重要度;所述步骤3包括:步骤3.1:将数据库中论文的一对一的引用关系转化为引用方向的映射集和被引用方向的映射集;步骤3.2:初步分析论文的引用关系,采取python程序设计语言中字典的数据结构;步骤3.3:提取两篇论文之间路径的信息;所述步骤3.1包括:初始化两个字典ref_dic,refed_dic,其中,ref_dic表示由论文中心节点到多个引用者的映射关系,refed_dic表示从由论文中心节点到多个被引用者的映射关系;遍历数据库中每行数据,在ref_dic字典键值中寻找任一行的左侧数据,若该行左侧数据已经在ref_dic字典键值中,则将该行右侧数据添加到键值对应项的尾部,若未在ref_dic字典键值中,则将左侧数据作为新键值保存,并将右侧数据作为对应的项,从而使得数据库中论文的一对一的引用关系转化为引用方向的映射集;对于refed_dic字典,则将右侧数据作为键值,左侧数据作为项,在refed_dic字典键值中寻找该行的右侧数据,若该行右侧数据已经在refed_dic字典键值中,则将该行左侧数据添加到键值对应项的尾部,若未在refed_dic字典键值中,则将右侧数据作为新键值保存,并将左侧数据作为对应的项,从而使得数据库中论文的一对一的引用关系转化为被引用方向的映射集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610131343.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top