[发明专利]轨道交通工程造价成果excel文件解析的技术方法在审
申请号: | 201911277529.7 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111026718A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 丁建隆;何霖;张志良;竺维彬;林志元;谭文;王健;吴敏;袁亮亮;姚世峰;孙成伟;谢国胜;李明亮;曹明华;周国鹏;苟俊琴;王斌;兰闯;刘铁民;邱坤;付亮;艾凌博;刘奎;梁倩韵;李平;莫华广;胡建廷;陈红仙;张涛;肖美娜;王志清;朱晓钰;叶方正;梁能奇 | 申请(专利权)人: | 广州地铁集团有限公司;广东中建普联科技股份有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/22;G06F16/2458 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轨道交通 工程造价 成果 excel 文件 解析 技术 方法 | ||
1.一种轨道交通工程造价成果excel文件解析的技术方法,其特征在于,包括如下步骤:
S1.获取各轨道交通造价成果excel文件,对excel文件内容格式进行识别,获取表格的行数、列数及有效单元格的信息,并提取有效单元格中的字段属性信息;
S2.根据提取的字段属性信息进行坐标定位并提取有效的关键特征字段以及数值;
S3.将有效的关键特征字段加入缓存消息队列,并通过Simhash算法对关键特征字段相似对度进行计算及统计,识别出未知特征和标准格式特征;
S4.将未知特征、标准格式特征以及相应的数值进行规约,并按照轨道交通工程项目标准结构自动统计和汇总形成初始解析文本;
S5.判断初始解析文本中是否存在未知特征,如果不存在,则设定其为标准解析文本,并存储至数据库中;如果存在未知特征,则将其进行二次解析,步骤如下:
S5.1.将初始解析文本中存在未知特征的部分进行屏蔽或拆分;
S5.2.通过Nakatsu算法从数据库中查找相似度匹配的标准解析文本;
S5.3.通过排序算法对比步骤S5.1中的初始解析文本以及步骤S5.2中的标准解析文本中,将步骤S5.2中的标准解析文本中的标准格式特征匹配至步骤S5.1中的初始解析文本中的未知特征,最后形成标准解析文本,并存储至数据库中。
2.根据权利要求1所述的一种轨道交通工程造价成果excel文件解析的技术方法,其特征在于,步骤S1中字段属性信息包括行名称和列名称。
3.根据权利要求1所述的一种轨道交通工程造价成果excel文件解析的技术方法,其特征在于,步骤S2中具体包括:将包含有关键特征字段的文本信息进行分词处理,并与关键词库进行匹配,得到有效的关键特征字段,所述关键词库以《城市轨道交通工程项目建设标准》中记载的工程种类及各个工程种类项目下的造价指标作为关键词。
4.根据权利要求1所述的一种轨道交通工程造价成果excel文件解析的技术方法,其特征在于,步骤S5和S5.3包括对标准解析文本按照工程项目数据层级进行统一编码。
5.根据权利要求4所述的一种轨道交通工程造价成果excel文件解析的技术方法,其特征在于,所述工程项目数据层级包括:建设规模、项目构成、总体布局、线路工程、车辆、限界、运营组织与管理、车站建筑、车站结构工程、机电系统、机电设备、安全防护、环保、主要技术经济指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州地铁集团有限公司;广东中建普联科技股份有限公司,未经广州地铁集团有限公司;广东中建普联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911277529.7/1.html,转载请声明来源钻瓜专利网。