[发明专利]一种基于文本挖掘的科技项目立项管理辅助决策方法及系统在审
申请号: | 202111587067.6 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114265935A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 李重杭;何维;汪伟;艾致衡 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F40/216;G06F40/289;G06K9/62 |
代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 潘中毅 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 挖掘 科技 项目 立项 管理 辅助 决策 方法 系统 | ||
本发明公开一种基于文本挖掘的科技项目立项管理辅助决策方法及系统,其中,方法包括:步骤S1,使用信息抽取技术对待评审科技项目数据库、历史科技项目数据库分别进行特征数据抽取,构建科技项目信息数据库;步骤S2,对所述特征数据进行分层文本相似度性挖掘,构建多层次多维度的科技项目相似度比对模型;步骤S3,获得待评审项目与其他项目在所述特征数据的相似度分数,在历史样本训练集上采用网格搜索方法对所述特征数据的权重进行更新迭代,得到一组最优权重;步骤S4,根据所述最优权重计算待评审项目与其他项目之间的相似度的综合得分。本发明减少人工筛选甄别主观因素,解决以往依靠专业人员人工比对项目相似度分析的效率、准确度不高的问题。
技术领域
本发明属于电力系统技术领域,具体涉及一种基于文本挖掘的科技项目立项管理辅助决策方法及系统。
背景技术
经过文献调研发现,国外没有项目相似度评估或查重的概念,但在大数据挖掘分析方面的研究起步早,进行了大量的研究探索,积累了丰富的经验和成熟的技术;科技项目相似度评估或查重本质上就是文本相似度计算方法,涉及关键信息抽取技术、分词技术、文本相似度计算技术等,科技项目相似度评估或查重受到这些技术发展的影响。
国外很多学者在文本相似度计算方面进行大量的研究并取得了很多成果。大致可分为两个阶段:第一个阶段主要是以向量计算以及语义计算的方法;第二个阶段则是近年来随着深度学习技术的成熟,越来越多的学者开始研究基于自学习的方式方法计算文本相似度。
国内在文本挖掘方法研究方面起步晚,但有针对性地开展文本挖掘方法在科技项目管理中的应用研究。姜韶华提出一种基于文本挖掘的科研项目管理原型系统,重点研究和解决科研项目文本的切分和特征建模等问题;左川提出一种基于非分词技术解决科技项目查重问题的方法,该方法不需要对文本进行分词处理,利用频繁闭项集构造向量空间模型对项目申请书进行建模并计算相似度;方延风提出将一种改进的TF—IDF方法用于科技项目查重,考虑了特征词的位置和长度两种因素;吴燕提出一种基于层次聚类的科技项目分类和查重方法,在计算科技项目相似性时综合考虑了应用领域、研究内容和技术来源等因素;林明才等提出一种改进的模糊聚类算法RM—FCM,在计算项目相似度时考虑了不同属性的特征项对科研项目的重要性;刘荫明等从科技查新实践、地区和部门多头管理、科研论文所依托的项目数量等方面研究我国科研的重复立项现象,通过对科研项目的申报与审批流程进行分析,提出避免重复立项的具体措施。
随着电力改革不断深入、科学技术不断持续发展,各专业类别的科学技术研究项目、科技成果的评审越来越多,随之而来的重复立项问题已日趋严重,从科技项目立项管理角度看,主要存在以下问题:首先,大量的科技项目非结构化数据难以甄别,待立项目相似性辨别耗费大量人力、物力;其次,科技项目申报主体综合竞争力难以评估,缺乏科学的申报主体竞争力评估体系;第三,精准推荐科技项目评审专家困难,依靠人工从评审专家库选择专家无法保证评审专家选择的合理性;因此,如何运用大数据、人工智能等前沿技术解决当前科技项目立项中多头立项、重复立项的问题,已然成为提升供电局科技项目立项管理水平的关键问题。
发明内容
本发明所要解决的技术问题在于,提供一种基于文本挖掘的科技项目立项管理辅助决策方法及系统,以减少人工筛选甄别主观因素,提高项目相似度分析的效率和准确度。
为解决上述技术问题,本发明提供一种基于文本挖掘的科技项目立项管理辅助决策方法,包括:
步骤S1,使用信息抽取技术对待评审科技项目数据库、历史科技项目数据库分别进行特征数据抽取,构建科技项目信息数据库;
步骤S2,对所述特征数据进行分层文本相似度性挖掘,构建多层次多维度的科技项目相似度比对模型;
步骤S3,获得待评审项目与其他项目在所述特征数据的相似度分数,在历史样本训练集上采用网格搜索方法对所述特征数据的权重进行更新迭代,得到一组最优权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111587067.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于产后恢复锻炼的调节架及使用方法
- 下一篇:一种节能型烤盘