[发明专利]科研热点预测方法及系统在审
申请号: | 202010628406.X | 申请日: | 2020-07-02 |
公开(公告)号: | CN111832815A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 马艳;邹立达;韩英昆;齐达立;马雷 | 申请(专利权)人: | 山东电力研究院;国网山东省电力公司电力科学研究院;国家电网有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/951;G06K9/62;G06N20/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250003 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 科研 热点 预测 方法 系统 | ||
本发明属于科研热点预测领域,提供了一种科研热点预测方法及系统。其中,科研热点预测方法包括提取当前周期内科技文本中所有热点关键词;根据热点关键词的TF‑IDF值,生成当前周期内所有热点关键词的时序数据;基于时序特征前置比较的方式,初步过滤当前周期内的热点关键词;将初步过滤后的热点关键词对应的时序数据分别与标准热点时序数据进行距离计算,筛选距离值不大于距离半径值对应的热点关键词作为科研热点;其中,距离半径值为首次热点出现的时序数据样本与其对应的标准热点时序数据的最远距离。
技术领域
本发明属于科研热点预测领域,尤其涉及一种科研热点预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
科研热点预测是科技情报领域较新的应用需求。科研工作者、科研项目管理者在选题、立项必须有一定的前瞻性,即立足于当前科学技术现状与社会发展情况,对未来可能产生的新理论或者产生应用价值的新技术做出判断。目前科研热点预测的方法严重依赖于本领域高级专业人员通过文献查阅与市场调研的方法确定热点出现的方向。另外,当一个新的理论与技术诞生后,其关联应用领域还需要大量的工作去发掘。科研领域中,科研热点词汇数量巨大,每种热点呈现的走势不尽相同,例如:以某热点科研词汇的点击量为例,其随着时间变化的趋势完全不同,如图1(a)和图1(b)所示。发明人发现,基于标准的机器学习模型拟合热点走势准确率不高。
发明内容
为了解决上述问题,本发明的第一个方面提供一种科研热点预测方法,其使得用户可以及时地获得未来一段时间科研热点主题预测推荐。
为了实现上述目的,本发明采用如下技术方案:
一种科研热点预测方法,包括:
提取当前周期内科技文本中所有热点关键词;
根据热点关键词的TF-IDF值,生成当前周期内所有热点关键词的时序数据;
基于时序特征前置比较的方式,初步过滤当前周期内的热点关键词;
将初步过滤后的热点关键词对应的时序数据分别与标准热点时序数据进行距离计算,筛选距离值不大于距离半径值对应的热点关键词作为科研热点;
其中,距离半径值为首次热点出现的时序数据样本与其对应的标准热点时序数据的最远距离。
为了解决上述问题,本发明的第二个方面提供一种科研热点预测系统,其使得用户可以及时地获得未来一段时间科研热点主题预测推荐。
为了实现上述目的,本发明采用如下技术方案:
一种科研热点预测系统,包括:
热点关键词提取模块,其用于提取当前周期内科技文本中所有热点关键词;
时序数据生成模块,其用于根据热点关键词的TF-IDF值,生成当前周期内所有热点关键词的时序数据;
预测加速模块,其用于基于时序特征前置比较的方式,初步过滤当前周期内的热点关键词;
热点预测模块,其用于将初步过滤后的热点关键词对应的时序数据分别与标准热点时序数据进行距离计算,筛选距离值不大于距离半径值对应的热点关键词作为科研热点;
其中,距离半径值为首次热点出现的时序数据样本与其对应的标准热点时序数据的最远距离。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的科研热点预测方法中的步骤。
本发明的第四个方面提供一种计算机设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东电力研究院;国网山东省电力公司电力科学研究院;国家电网有限公司,未经山东电力研究院;国网山东省电力公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010628406.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理