[发明专利]基于科技文献资源的地理科学数据需求分析方法及装置有效
申请号: | 202211476732.9 | 申请日: | 2022-11-23 |
公开(公告)号: | CN116127086B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 周昆;邱琳;李伊黎;冯功学;康昕怡;孙端;常中兵;傅海鑫;罗小梅;王祯 | 申请(专利权)人: | 广东省国土资源测绘院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/34;G06F16/951;G06F40/216;G06F40/289;G06F40/295 |
代理公司: | 广州科粤专利商标代理有限公司 44001 | 代理人: | 邓潮彬 |
地址: | 510663 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 科技 文献 资源 地理 科学 数据 需求 分析 方法 装置 | ||
1.一种基于科技文献资源的地理科学数据需求分析方法,其特征在于,所述方法包括:
构建文献资源数据库;
对文献资源数据库中的文献进行分词处理和数据名称识别,并对同一篇文献中重复出现的数据名称进行去重处理,将数据名称存储到文献资源数据库中;
构建标准数据名称列表,通过数据名称匹配,将多样的、不统一的数据名称词汇,统一到规范的、唯一性的数据名称上;
按照数据名称列表,进行数据名称的词频统计,利用科技文献总数和数据名称频数构建需求指数;
利用需求指数绘制数据名称云图;以词汇的大小表征数据需求的大小,并在各个数据资源的需求指数的基础上,结合时间信息绘制数据需求走势图;
将不同关键词作为对象,根据关键词相似度进行聚类,使得语义关系相近的关键词聚在一起形成一个类团,并引入粘合力,用以衡量类团内每个关键词对类团聚集过程的贡献程度,选择类团中粘合力最大的词作为中心词,参考中心词对每个类团进行总结命名,获得主要研究方向;
基于文献资源数据库,通过对聚类结果形成的主要研究方向、关键词和数据资源名称进行数据融合和关系抽取,并计算各个研究方向中各类数据的需求指数,以数据需求指数为边,构建研究方向和数据资源的科学知识图谱;
所述数据需求指数的计算公式为:
上式中,Xk是第k个数据名称的需求指数;Nk为第k个数据名称的频数,n为科技资源总数,为第k个数据名称的科技资源数量占科技资源总数的比例;
所述构建文献资源数据库包括:
构建文献资源基础库:根据地理学科相关领域建立主题词库,以知识数据库科技文献资源为数据源,利用爬虫技术按照主题词进行出版物检索,获取相应的科技文献数据集,形成文献资源基础库;
构建关键词词集:对所有爬取到的科技文献的标题、关键词、摘要进行分词处理,删除结构性词汇,去除动词、形容词词性词汇,仅保留名词,并通过专业文献日常用词语料库匹配排除法,剔除日常用词,构建关键词词集;
文献资源库更新:按照关键词词集,以知识数据库科技文献资源为数据源,再次采用爬虫技术获取更多的相关科技文献信息,并将获得的标题、摘要、关键词和出版时间信息存储到数据库中。
2.如权利要求1所述的基于科技文献资源的地理科学数据需求分析方法,其特征在于,所述粘合力的计算公式为:
式中,关键词Ai的粘合度用N(Ai)表示,E(Ai→Aj)表示关键词Ai与本类团中其余关键词的共现频次。
3.如权利要求1所述的基于科技文献资源的地理科学数据需求分析方法,其特征在于,基于自然语言处理算法包的分词模块与实体词识别模块,对爬取到的标题、关键词、摘要数据进行分词处理和数据名称识别。
4.如权利要求1所述的基于科技文献资源的地理科学数据需求分析方法,其特征在于,对所述需求指数进行归一化处理。
5.如权利要求1所述的基于科技文献资源的地理科学数据需求分析方法,其特征在于,利用浏览数据官方网站、查阅领域相关专著、咨询专家来构建标准数据名称列表。
6.如权利要求1所述的基于科技文献资源的地理科学数据需求分析方法,其特征在于,所述数据需求走势图为数据需求年走势图。
7.一种基于科技文献资源的地理科学数据需求分析装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省国土资源测绘院,未经广东省国土资源测绘院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211476732.9/1.html,转载请声明来源钻瓜专利网。