[发明专利]一种技术文献信息提取方法、系统及存储介质有效

专利信息
申请号: 202111086474.9 申请日: 2021-09-16
公开(公告)号: CN113722472B 公开(公告)日: 2022-09-09
发明(设计)人: 熊蕊 申请(专利权)人: 北京市科学技术研究院
主分类号: G06F16/34 分类号: G06F16/34;G06F16/36;G06F16/383
代理公司: 北京高沃律师事务所 11569 代理人: 赵兴华
地址: 100089 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 技术 文献 信息 提取 方法 系统 存储 介质
【说明书】:

发明提出了一种技术文献信息提取方法、系统及存储介质,根据技术人员想要研究的技术领域进行检索技术文献,对技术文献进行预处理,并且能够根据预处理后得到的汇总列表进行综合图表数据集的生成,还能够根据技术人员感兴趣的特定的学者或机构或关键词进行特定图表数据集的生成,并且将综合图表数据集和特定图表数据集以数据表格和可视化图谱形式展现,从而便于技术人员对当前领域的发展方向或对特定的研究学者、研究机构或关键词的发展方向进行分析;整个流程只需要技术人员输入要研究的方向或要研究的学者、机构或关键词,不需要使用多个工具,操作步骤简洁,能够很好的支撑研究人员进行学科领域发展分析。

技术领域

本发明涉及文献信息提取技术领域,特别是涉及一种技术文献信息提取方法、系统及存储介质。

背景技术

目前,学科领域发展分析是技术工作者的研究的重点之一,可以使技术人员及行业决策者在较快的时间内掌握领域的进展、动态及趋势,从而起到决策支撑的作用,有利于相关研究人员及研究机构及时准确地把握发展的脉络和先机,辅助支撑决策者或者决策部门进行决策。

为满足各学科领域用户从海量文献信息获取满足自己需求和对这些信息进行批量式处理的双重需求,国内外学者和机构开发出不同的文献信息提取的软件,比如,BibExcel、CiteSpace、Gephi和Ucinet等。其中,BibExcel具有抽取文献中的知识单元间的关系矩阵的功能,但是操作步骤复杂;Citespace在做作者和机构合作网络时,图谱绘制结果通常不太理想;Ucinet是一款社会网络分析工具,适合分析较大的数据集,但是没有数据清洗功能,分析对象必须为关联数据,Gephi的分析对象也必须为关联数据;所以目前很多开发者先是采用python对原始数据进行数据处理生成关系矩阵,然后再输入Gephi进行可视化分析。国内常用的知网万方虽然能够直接对检索结果进行可视化计量分析,但是很难做到检索式的搜索结果完全准确和全面,搜索结果含有一定的噪声,并且也只能显示有限数量。

综上,可见在对某个学科领域进行发展分析时,关键在于待分析的文献的准和全,相关人员需要随着对学科领域不断了解深入,不断地根据文献信息提取结果以及相关专业知识积累,不断地调整检索式,清除噪声文献,尽可能地实现文献检索的准和全,在得到相对满意结果这一过程中,需要多次更新检索文献结果,多次对检索文献信息提取结果分析,文献信息提取工具使用步骤复杂,图谱绘制结果通常不太理想,仅采用关系网络等可视化计量进行分析,并不能完整反应历史发展脉络,需要同时使用多个文献信息提取工具,操作步骤复杂,会产生较大的工作量。

针对以上的问题,提出一种对于多次更新的技术文献检索结果可以进行自动处理,不需要使用多个工具,处理步骤简洁,对更好的支撑研究人员进行学科领域发展分析是非常有必要的。

发明内容

本发明的目的是提供一种技术文献信息提取方法、系统及存储介质,解决传统的文献信息提取方法中需要多个软件共同使用,步骤繁琐,操作复杂的问题。

为实现上述目的,本发明提供了如下方案:

一种技术文献信息提取方法,包括以下步骤:

根据用户输入的检索文本,在文献检索网站上检索得到与检索文本对应的若干条技术文献信息;

对所述若干条技术文献信息进行预处理,得到技术信息汇总列表;

根据所述技术信息汇总列表,生成综合图表数据集;

根据用户选择输入的内容,生成对应的特定图表数据集进行显示;

所述综合图表数据集和特定图表数据集包括以数据表格和可视化图谱形式展现的图表数据。

进一步的,对所述若干条技术文献信息进行预处理具体包括:

将若干条技术文献信息以列表文件形式导出,得到若干个文献列表;其中,在所述文献列表文件中,除表头以外每行内容对应一条技术文献信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市科学技术研究院,未经北京市科学技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111086474.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top