[发明专利]文献热点的可视化分析方法在审
申请号: | 201810523242.7 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108959378A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 戴维迪;李胜男 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可视化 研究 主题网络 字段 预处理 改变数据 期刊数据 设定条件 有效分析 分析 数据源 维度 期刊 检测 改进 | ||
1.文献热点的可视化分析方法,其特征在于,该方法包括如下步骤:
S1:研究数据的获取及处理:
(1)确定需要研究的领域,爬取领域期刊数据;
(2)提取所需研究字段;
(3)对获取的关键词字段进行预处理;
S2:研究主题的检测:
(1)对预处理所得的数据,使用共词分析方法来得到研究领域的研究主题,并使用可视化分析来得到领域研究热点;
(2)根据关键词的共现建立关键词共现网络,将关键词的共现频率作为边的权重,关键词作为网络的节点;
(3)使用等价指数eij计算关键词之间的相似性,对网络边的权重进行归一化:
其中,cij是两个关键词i和j共同出现的文档数量,ci和cj表示每个关键词出现的文档数量;
S3:可视化研究主题和主题网络
(1)计算网络中心性c,衡量一个主题与其它主题的交互程度:
c=10·∑ekh
其中,k属于主题的关键词,h是属于其他主题的关键词;
(2)计算网络密度d,衡量主题的发展情况:
其中,i和j是属于主题的关键词,w是主题中的关键词的数量;
(3)使用网络中心性和密度画出战略图,将二维战略图进行扩展,使战略图中主题词的体积大小与关键词出现的频率成正比,主题词由频率最高的关键词决定;
(4)根据关键词的共现绘制主题网络,在每个主题网络中,使用相关主题中最重要的关键词进行标记;
(5)使用战略图和主题网络结合领域知识对领域热点进行分析,进一步了解领域发展现状,指导未来研究。
2.根据权利要求1所述的文献热点的可视化分析方法,其特征在于,所述步骤S1(1)中确定需要研究的领域是根据领域期刊影响因子进行排序。
3.根据权利要求1所述的文献热点的可视化分析方法,其特征在于,所述步骤S1(2)中研究字段包括关键词字段。
4.根据权利要求1所述的文献热点的可视化分析方法,其特征在于,所述步骤S1(3)中预处理包括合并关键词的单复数和对同义关键词进行合并处理。
5.根据权利要求1所述的文献热点的可视化分析方法,其特征在于,所述步骤S2(1)中共词分析方法具体描述为:基于文献中关键词的共现频率,通过分析两个关键词一起出现的文档集,从文档集中提取两个关键词的共现频率。
6.根据权利要求1所述的文献热点的可视化分析方法,其特征在于,所述步骤S3(4)中主题网络中边的粗细程度与等价强度eij成正比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810523242.7/1.html,转载请声明来源钻瓜专利网。