[发明专利]一种基于主题可视化的探索机构研究状况的方法在审
申请号: | 202010092905.1 | 申请日: | 2020-02-14 |
公开(公告)号: | CN111339286A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 秦红星;曹鑫霞 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/338 | 分类号: | G06F16/338;G06F16/35;G06F16/33;G06F40/289 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 杨柳岸 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 可视化 探索 机构 研究 状况 方法 | ||
本发明涉及一种基于主题可视化的探索机构研究状况的方法,属于可视化技术领域。该方法包括以下步骤:S1:研究数据的获取以及预处理,具体为确定需要研究的机构,获取所研究机构的SCI学术文献数据;提取所需的研究字段,对获取的研究语料进行预处理;S2:采用TF‑IDF特征提取和LDA主题模型文本挖掘技术对所选语料库进行处理,提取科研热点主题及其主题词,并且进行学术文献主题聚类;S3:将聚类主题以及学术文献数据中其他维度信息以可视化的方式呈现出来,从多个维度对结果进行分析。本发明有利于能够更好的掌握并跟踪时下机构科研状况发展状况,以更好的让科研人员捕获学科发展的前沿与热点,避免重复研究。
技术领域
本发明属于可视化技术领域,涉及一种基于主题可视化的探索机构研究状况的方法。
背景技术
近年来科研工作者人数的迅速增长,并且伴随计算机网络和信息技术的广泛应用,学术文献越来越海量化、多样化和即时化,这一现象使科研热点的发展趋势无法人为的跟踪和处理。可视分析是一项近几年发展起来的新兴技术,是信息可视化和科学可视化领域发展的产物,是人们理解和诠释大规模复杂情况的有效手段和途径,可视分析技术通过可视化算法,实现图形化的可视化模型,用来展示多位或者高维数据。结合了人机交互的可视化模型还可以进行动态的多角度分析。
基于主题模型的文献热点分析是探索研究某一领域状况的一个重要方法,主要通过对该领域所发表的学术文献或者专利进行分析,其中学术文献是该领域研究发展的一个重要体现。目前对于文献的研究分析,通过主题建模,然后使用可视化方式来展示有关该领域主题模型的多尺度信息,或者在主题模型的多尺度信息上设计交互操作来提升主题模型。
一个机构所发表的学术文献承载着科学研究在各个主题方面的研究成果。目前,科学研究趋于多极化,科学主题体现为繁、杂、乱等特点。研究人员人数众多,各个科研机构的侧重点不同。通过对科研机构的学术文献进行主题建模,结合多个维度信息通过可视化分析,了解和跟踪当前科研机构研究状况及发展状态。
发明内容
有鉴于此,本发明的目的在于提供一种基于主题可视化的探索机构研究状况的方法,针对现有的主题模型可视分析系统中缺乏对某一机构的研究状况问题,本发明提出的基于主题可视化的机构研究状况的方法,以某机构所发表的学术文献为研究对象,进行主题建模,以可视化的方式呈现科研主题的发展态势,把握科研热点的发展趋势,以更好的捕获学科发展前沿和热点。
为达到上述目的,本发明提供如下技术方案:
一种基于主题可视化的探索机构研究状况的方法,该方法包括如下步骤:
S1:研究数据的获取以及处理:
确定需要研究的机构,获取所需机构的SCI学术文献数据;
提取所需研究字段;
对提取的字段进行预处理;
S2:采用TF-IDF特征提取和LDA主题模型分析技术对所选语料库进行处理;
对预处理所得的数据,使用TF-IDF特征提取和生成,建立整个语料库的特征向量空间模型;
LDA算法利用语料库生成的特征向量空间模型建立主题模型,利用Gibbs采样方法对所建立的主题模型进行计算,输出并存储主题-词矩阵;
对所输出的主题-词矩阵进行聚类分析,存储并输出聚类结果;
S3:将聚类主题以及学术文献中其他维度信息以可视化的方式呈现出来,从多个维度对结果进行分析;
使用河流图、文字云和折线图分别展示主体强度随时间的变化、每个主题所代表的研究领域、以及主题被引频次的变化;
树状图、条形图分别展示每个主题下的层次结构,并分析每个分支机构就对该主题学术影响力的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010092905.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算机硬件检测平台
- 下一篇:一种基于支撑时相的奶牛跛行检测方法与系统