[发明专利]基于特征词匹配的项目工期合理性判断方法及装置在审
申请号: | 202110251849.6 | 申请日: | 2021-03-08 |
公开(公告)号: | CN113064978A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 刘义江;陈蕾;侯栋梁;池建昆;范辉;阎鹏飞;魏明磊;李云超;姜琳琳;辛锐;陈曦;杨青;沈静文;吴彦巧;姜敬;檀小亚;师孜晗 | 申请(专利权)人: | 国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/284;G06F40/289;G06Q10/06;G06Q30/02 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 呼春辉 |
地址: | 050022 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 匹配 项目 工期 合理性 判断 方法 装置 | ||
1.一种基于特征词匹配的项目工期合理性判断方法,其特征在于:包括如下步骤,S1历史项目关键词抽取,处理器从历史项目内容信息文本中抽取历史项目关键词,S2构建多层级项目信息库,处理器根据历史项目关键词构建多层级项目信息库,S3项目信息库分级搜索,处理器从项目进展报告中抽取新项目关键词,将新项目关键词遍历多层级项目信息库与历史项目关键词进行分级搜索匹配并获得匹配结果,S4项目工期合理性判断,根据匹配结果判断合理性。
2.根据权利要求1所述的基于特征词匹配的项目工期合理性判断方法,其特征在于:在步骤S1中,处理器获取历史项目内容信息文本,从历史项目内容信息文本中抽取关键词并形成历史项目关键词;在步骤S2中,多层级项目信息库的结构为链式存储结构,多层级项目信息库的信息包括节点的编号ID、关键词、父亲节点、孩子节点和信息来源,在多层级项目信息库中存储的信息为历史项目信息;在步骤S3中,处理器获取项目进展报告,识别并获取项目进展报告中的内容,通过TF-IDF算法提取项目进展报告内容中的关键词,将该关键词与多层级项目信息库中的历史项目信息通过编辑距离作为相似性度量的标准分层依次向下比对,将多层级项目信息库中的关键词按照相似性从高到低排列。
3.根据权利要求2所述的基于特征词匹配的项目工期合理性判断方法,其特征在于:在步骤S1中,采用开源工具jieba将历史项目内容信息文本拆分成词组,通过TF-IDF算法,计算每一词组的TF-IDF值,根据TF-IDF值获得历史项目关键词。
4.根据权利要求1所述的基于特征词匹配的项目工期合理性判断方法,其特征在于:在步骤S4中,处理器从多层级项目信息库中获取与项目进展报告内容中的关键词相似度最高的前十条记录,从其相应的信息来源中提取历史项目的价格和工期的信息作为相似项目参考标准,处理器计算新项目的预算价格和工期,对比新项目的预算工期与历史项目的工期、对比新项目的预算价格与历史项目的价格并相应得到工期和价格的对比值,对比值超出设定的预警范围则认为不合理,对比值在设定的预警范围内则认为合理。
5.一种基于特征词匹配的项目工期合理性判断装置,其特征在于:包括历史项目关键词抽取模块、构建多层级项目信息库模块、项目信息库分级搜索模块和项目工期合理性判断模块共四个程序模块,历史项目关键词抽取模块,用于处理器从历史项目内容信息文本中抽取历史项目关键词,构建多层级项目信息库模块,用于处理器根据历史项目关键词构建多层级项目信息库,项目信息库分级搜索模块,用于处理器从项目进展报告中抽取新项目关键词,将新项目关键词遍历多层级项目信息库与历史项目关键词进行分级搜索匹配并获得匹配结果,项目工期合理性判断模块,用于根据匹配结果判断合理性。
6.根据权利要求5所述的基于特征词匹配的项目工期合理性判断装置,其特征在于:历史项目关键词抽取模块,还用于处理器获取历史项目内容信息文本,从历史项目内容信息文本中抽取关键词并形成历史项目关键词;构建多层级项目信息库模块,还用于多层级项目信息库的结构为链式存储结构,多层级项目信息库的信息包括节点的编号ID、关键词、父亲节点、孩子节点和信息来源,在多层级项目信息库中存储的信息为历史项目信息;项目信息库分级搜索模块,还用于处理器获取项目进展报告,识别并获取项目进展报告中的内容,通过TF-IDF算法提取项目进展报告内容中的关键词,将该关键词与多层级项目信息库中的历史项目信息通过编辑距离作为相似性度量的标准分层依次向下比对,将多层级项目信息库中的关键词按照相似性从高到低排列。
7.根据权利要求6所述的基于特征词匹配的项目工期合理性判断装置,其特征在于:历史项目关键词抽取模块,还用于采用开源工具jieba将历史项目内容信息文本拆分成词组,通过TF-IDF算法,计算每一词组的TF-IDF值,根据TF-IDF值获得历史项目关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司,未经国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110251849.6/1.html,转载请声明来源钻瓜专利网。