[发明专利]处理列车数据的方法、装置及存储介质在审
申请号: | 201910505731.4 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110222093A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 王洪昆;王文刚;卢宇星;康凤伟;李权福;王蒙;边志宏;方琪琦;王萌;刘洋;张宁 | 申请(专利权)人: | 中国神华能源股份有限公司;神华铁路货车运输有限责任公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q10/06;G06Q50/30 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 100011 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 列车数据 匹配结果 数据类型 预设标准 存储介质 转换数据 匹配 数据处理技术 相似度匹配 多源数据 健康状态 来源数据 匹配标准 数据丢失 列车 不一致 综合分析 标准化 数据库 存储 评估 转换 | ||
本发明涉及列车数据处理技术领域,公开了一种处理列车数据的方法、装置及存储介质,解决了现有技术中利用多个来源数据综合分析评估列车的健康状态时,由于表述和格式不一致造成的数据丢失、不完整等问题。所述方法包括:获取待转换的列车数据;根据预设标准数据类型,确定所述列车数据的数据类型匹配结果;当所述数据类型匹配结果为匹配时,根据所对应的预设标准数据类型对应的匹配标准,将所述列车数据进行相似度匹配,并确定所述列车数据的匹配结果以及对应的转换数据;当所述列车数据的匹配结果为匹配时,将所述列车数据对应的转换数据存入预设标准数据库中。本发明实施例还用于将多源数据进行标准化存储的过程。
技术领域
本发明涉及列车数据处理技术领域,具体地,涉及一种处理列车数据的方法、装置及存储介质。
背景技术
目前与铁路列车健康状态有关的数据来源较多,例如,5t系统数据、HMIS(Hmanagement information system,铁路货车技术管理信息系统)数据、制造厂家数据、列车调度系统数据、列车运行环境数据等。不同系统对同一列车零部件或其他对象的表述方法经常会出现不一致现象,特别是人工录入的数据,常常会存在多种表述方式。这给通过多个来源数据综合分析评估列车的健康状态造成了数据的丢失、不完整等很多问题。
发明内容
本发明实施例的目的是提供一种处理列车数据的方法、装置及存储介质,利用基于相似度的语义识别方法,将多种表达方式的同类数据转换为标准化数据,解决了现有技术中利用多个来源数据综合分析评估列车的健康状态时,由于表述和格式不一致造成的数据丢失、不完整等问题,保证了数据表述的一致性和完整性。
为了实现上述目的,本发明提供一种处理列车数据的方法,所述方法包括:获取待转换的列车数据;根据预设标准数据类型,确定所述列车数据的数据类型匹配结果;当所述数据类型匹配结果为匹配时,根据所对应的预设标准数据类型对应的匹配标准,将所述列车数据进行相似度匹配,并确定所述列车数据的匹配结果以及对应的转换数据;当所述列车数据的匹配结果为匹配时,将所述列车数据对应的转换数据存入预设标准数据库中。
进一步地,所述根据预设标准数据类型,确定所述列车数据的数据类型匹配结果包括:提取所述列车数据中的原始数据类型;根据数据类型关系以及所述预设标准数据类型,查找所述原始数据类型对应的预设标准数据类型;当未查找到所述原始数据类型对应的预设标准数据类型时,确定所述数据类型匹配结果为不匹配;当查找到所述原始数据类型对应的预设标准数据类型时,确定所述数据类型匹配结果为匹配。
进一步地,所述预设标准数据类型包括字符串型和数字型,所述根据所对应的预设标准数据类型对应的匹配标准,将所述列车数据进行相似度匹配,并确定所述列车数据的匹配结果以及对应的转换数据包括:根据所述字符串型对应的关键字以及关键字权重,将所述列车数据中的字符串数据与所述关键字进行相似度匹配,得到所述列车数据中的字符串匹配结果以及对应的转换数据;根据所述数字型对应的数值范围,将所述列车数据中的数值与所述数值范围进行匹配,得到所述列车数据中的数值匹配结果。
进一步地,所述根据所述字符串型对应的关键字以及关键字权重,将所述列车数据中的字符串数据与所述关键字进行相似度匹配,得到所述列车数据中的字符串匹配结果以及对应的转换数据包括:根据所述字符串型对应的关键字,将所述列车数据中的字符串数据与所述关键字进行相似度匹配;当未得到匹配的字符串数据以及关键字时,确定所述列车数据中的字符串匹配结果为不匹配;当得到匹配的字符串数据以及关键字时,确定所述列车数据中的字符串匹配结果为匹配,并判断所匹配的字符串数据中是否存在同一个字符匹配多个关键字;当不存在同一个字符匹配多个关键字的情况时,确定所匹配的关键字为所述列车数据对应的字符串转换数据;当存在同一个字符匹配多个关键字的情况时,查找所述多个关键字对应的关键字权重中的最大权重,将所述最大权重对应的关键字确定为所述字符的关键字,并将所述字符的关键字与所匹配的其它关键字确定为所述列车数据对应的转换数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国神华能源股份有限公司;神华铁路货车运输有限责任公司,未经中国神华能源股份有限公司;神华铁路货车运输有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910505731.4/2.html,转载请声明来源钻瓜专利网。