[发明专利]一种工程量清单自动组价方法和装置有效
申请号: | 201910146113.5 | 申请日: | 2019-02-27 |
公开(公告)号: | CN111127068B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 宋卫国 | 申请(专利权)人: | 上海万亩电子科技有限公司 |
主分类号: | G06Q30/0283 | 分类号: | G06Q30/0283;G06Q50/08;G06F40/242;G06F40/289;G06F40/216 |
代理公司: | 上海骁象知识产权代理有限公司 31315 | 代理人: | 赵俊寅 |
地址: | 200441 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工程量 清单 自动 方法 装置 | ||
1.一种工程量清单自动组价方法,其特征在于,包括:
获取一条清单子目的清单描述信息;
利用行业字典库对所述清单描述信息进行分词得到清单关键词,所述清单关键词为一个或多个;
根据所述清单子目的识别标识确定对应的定额组价方案组;
利用行业字典库对所述定额组价方案组中每个定额组价方案进行分词得到每个定额组价方案的方案关键词;
比较所述清单关键词与每个所述定额组价方案的方案关键词的相似度确定所述清单子目对应的定额组价方案;
所述行业字典库的建立包括:
收集已完成建设工程预算书电子文件中所有清单子目的清单描述信息和定额方案描述信息;
根据预设的分隔符将所有的清单描述信息和定额方案描述信息分隔形成一串短句列表;
将每一串短句的每一个字作为一个节点,并根据前后位置关系建立树结构,并记录前后字组成的词出现的次数;
根据词频顺序输出词及词频生成行业字典库。
2.根据权利要求1所述的一种工程量清单自动组价方法,其特征在于,所述根据词频顺序输出词及词频生成行业字典库的步骤还包括:
去除根据词频顺序输出词中单个字的词。
3.根据权利要求1所述的一种工程量清单自动组价方法,其特征在于,所述根据所述清单子目的识别标识确定对应的定额组价方案组的步骤包括:
根据所述清单子目的识别标识在定额组价方案库找到对应的多个将定额组价方案;
将多个将定额组价方案组成定额组价方案组。
4.根据权利要求3所述的一种工程量清单自动组价方法,其特征在于,所述定额组价方案组的定额方案组关键词通过行业字典库进行挖掘,具体包括:
收集相同定额组价方案的定额描述信息,所述相同定额组价方案构成定额组价方案组;
利用行业字典库对相同定额组价方案的定额描述信息进行分词得到所述定额组价方案组的方案关键词;
利用行业字典库对相同定额组价方案对应的多个清单子目描述信息进行分词得到所述定额组价方案组的清单关键词;
对比所述定额组价方案组的清单关键词和方案关键词,将相同的关键词作为所述定额组价方案组的定额方案组关键词。
5.根据权利要求4所述的一种工程量清单自动组价方法,其特征在于,所述对比所述定额组价方案组的清单关键词和方案关键词,将相同的关键词作为所述定额组价方案组的定额方案组关键词的步骤还包括:
对所述相同的关键词进行词频分析,去掉低频的关键词。
6.根据权利要求4所述的一种工程量清单自动组价方法,其特征在于,所述对比所述定额组价方案组的清单关键词和方案关键词,将相同的关键词作为所述定额组价方案组的定额方案组关键词的步骤之后还包括:
保存所述定额方案组关键词到定额组价方案组。
7.根据权利要求1所述的一种工程量清单自动组价方法,其特征在于,所述比较所述清单关键词与每个所述定额组价方案的方案关键词的相似度确定所述清单子目对应的定额组价方案的步骤包括:
计算所述清单关键词与每个所述定额组价方案的方案关键词的Jaccard相似度分值;
统计每个所述定额组价方案的流行频率;
确定Jaccard相似度分值最高且流行频率最高的定额组价方案为所述清单子目对应的定额组价方案。
8.根据权利要求1-7任一所述的一种工程量清单自动组价方法,其特征在于,所述清单子目的识别标识为清单子目编号的前九位。
9.一种工程量清单自动组价系统,其特征在于,包括:
获取模块,用于获取一条清单子目的清单描述信息;
清单关键词生成模块,用于利用行业字典库对所述清单描述信息进行分词得到清单关键词,所述清单关键词为一个或多个;
定额组价方案组确定模块,用于根据所述清单子目的识别标识确定对应的定额组价方案组;
方案关键词生成模块,用于利用行业字典库对所述定额组价方案组中每个定额组价方案进行分词得到每个定额组价方案的方案关键词;
比较模块,用于比较所述清单关键词与每个所述定额组价方案的方案关键词的相似度确定所述清单子目对应的定额组价方案;
所述行业字典库的建立包括:
收集已完成建设工程预算书电子文件中所有清单子目的清单描述信息和定额方案描述信息;
根据预设的分隔符将所有的清单描述信息和定额方案描述信息分隔形成一串短句列表;
将每一串短句的每一个字作为一个节点,并根据前后位置关系建立树结构,并记录前后字组成的词出现的次数;
根据词频顺序输出词及词频生成行业字典库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海万亩电子科技有限公司,未经上海万亩电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910146113.5/1.html,转载请声明来源钻瓜专利网。