[发明专利]轨道交通维修工单关键词提取方法及装置在审
申请号: | 202011015127.2 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112214990A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 李振;包峰;罗铭 | 申请(专利权)人: | 交控科技股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/35 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马瑞 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轨道交通 维修工 关键词 提取 方法 装置 | ||
本发明实施例提供一种轨道交通维修工单关键词提取方法及装置,首先获取维修工单语料库,并计算语料库中各词语的词频与逆向文件频率的乘积;然后基于维修工单语料库中各词语的初始权重,以及各词语的词频与逆向文件频率的乘积,确定维修工单语料库中各词语的实际权重;最后根据维修工单语料库中各词语的实际权重,确定轨道交通维修工单关键词。充分利用了轨道交通维修工单数据,通过对轨道交通维修工单数据进行处理确定出轨道交通维修工单关键词,进而可以通过关键词对轨道交通维修工单进行分类,可以更快速的确定轨道交通维修工单中出现的问题并找到问题的原因。
技术领域
本发明涉及轨道交通技术领域,尤其涉及一种轨道交通维修工单关键词提取方法及装置。
背景技术
轨道交通技术发展迅速。从维修角度考虑,运营维护是地铁系统安全运营的重要环节。轨道交通维修过程中,通常采用人工记录工单的方法,在长期的地铁运行检修过程中工单积累数量越发增多。工单数据中记录了故障发生的原因,故障发生的描述和故障的解决方案,有较大的信息量。
轨道设备提供的数据符合大数据特征。其数据多样,不同轨道设备在不同生命周期时间产生种类众多、内容庞杂的数据。数据格式多样,包括传统的纸质类数据如人工线路检查记录本、轨检仪格式数据、车载控制系统(Vehicleon-board Controller,VOBC)、行车记录数据等等。数据结构多样,包括结构化数据、半结构化数据、非结构化数据等等。数据规模庞大,以轨道检查车检测数据为例,按正线每月检测二次,相应的波形数据和超限数据存放在数据库中,一年的数据量可达9TB。
然而,目前工单数据并未被有效利用,若如此大量的数据并未有效利用,对确定故障发生原因并无益处。
发明内容
本发明实施例提供一种轨道交通维修工单关键词提取方法及装置,用以解决现有技术中存在的缺陷。
本发明实施例提供一种轨道交通维修工单关键词提取方法,包括:
获取维修工单语料库,计算所述语料库中各词语的词频以及各词语的逆向文件频率,并确定各词语的词频与逆向文件频率的乘积;所述维修工单语料库为包含指定数量个轨道交通维修工单中出现的词语的集合;
基于所述维修工单语料库中各词语的初始权重,以及各词语的词频与逆向文件频率的乘积,确定所述维修工单语料库中各词语的实际权重;所述初始权重基于所述维修工单语料库中各词语的重要性确定;
基于所述维修工单语料库中各词语的实际权重,确定轨道交通维修工单关键词。
根据本发明一个实施例的轨道交通维修工单关键词提取方法,还包括:
接收待查询关键词,并确定包含有所述待查询轨道交通维修工单关键词的所有备选轨道交通维修工单;
计算每个备选轨道交通维修工单的权重,并将权重较高的备选轨道交通维修工单作为所述待查询关键词对应的轨道交通维修工单。
根据本发明一个实施例的轨道交通维修工单关键词提取方法,所述基于所述维修工单语料库中各词语的初始权重,以及各词语的词频与逆向文件频率的乘积,确定所述维修工单语料库中各词语的实际权重,具体包括:
基于所述初始权重,以及各词语的词频与逆向文件频率的乘积,结合调谐参数,确定所述实际权重。
根据本发明一个实施例的轨道交通维修工单关键词提取方法,所述基于所述初始权重,以及各词语的词频与逆向文件频率的乘积,结合调谐参数,确定所述实际权重,具体包括:
基于所述初始权重,以及各词语的词频与逆向文件频率的乘积,结合调谐参数,确定中间权重;
基于最大最小归一化方法,对所述中间权重进行归一化处理,得到所述实际权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交控科技股份有限公司,未经交控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011015127.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:轨道交通数据共享系统、方法、电子设备及存储介质
- 下一篇:磁吸式行车记录仪