[发明专利]面向新型供电城轨列车数据运维的自然语言查询解析方法有效
申请号: | 201910936345.0 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110727695B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 吴晓凡;刘晋;潘硕;李辉;田野;陈刚;陈珂;江大伟 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 新型 供电 列车 数据 自然语言 查询 解析 方法 | ||
本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。
技术领域
本发明涉及计算机机器学习领域中的语言数据查询方法,尤其是涉及了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。
背景技术
在新型供电城轨列车运维系统中,对所存储的数据进行查询是最频繁也是最重要的操作。传统的查询方式需要精通数据库查询语法的用户为每一个查询编写结构化查询语句,随着业务规模的扩大和人工智能技术的发展,现代的个性化运维系统对使用自然语言的查询方式提出了迫切的需求。与传统查询方式相比,通过对自然语言查询进行解析,把自然语言转换为结构化查询语句,能够使用户在不需要了解数据具体存储方式的情况下快速地实现查询意图。这种自然语言查询解析技术能够大大地提高新型城轨列车个性化运维系统的查询便利性和使用效率,在业务数据规模不断扩大的背景下,使个性化运维系统为大数据的管理和使用提供更好的支撑。
近年来,随着人工智能技术的快速发展,自然语言查询的解析方法集中在神经网络领域。这类方法一般将自然语言查询和数据库的字段名称进行词嵌入表示作为模型输入,通过序列-序列或者序列-集合的模型结构生成结构化查询语句。但是实际场景下的自然语言查询在很多情况下不会显式地出现字段名称,因此仅使用词向量建模两者的语义联系具有较大的局限性。一些最新的方法采用了外部知识库、概念网络以及预训练模型等外部资源来增强对自然语言和字段的语义表示,但是这些外部资源的获取和存储对网络环境和存储空间有很高的要求,不适合在新型城轨列车运维的实际场景中使用。
发明内容
本发明的目的在于针对新型供电城轨列车运维数据处理,提供了一种面向新型供电城轨列车数据运维的自然语言查询解析方法,方法上将已存储的数据所带来的丰富信息加入到神经网络模型中,在获取成本低、存储代价小、使用效率高的基础上提高了对结构化查询语句的预测准确率。
本发明解决问题的技术方案如下:
(1)新型供电城轨列车运行时采集获得的运维数据存储于数据库中,运维数据包括车辆运行能耗参数、车厢空气细颗粒物浓度参数等。由运维数据的一个自然语言查询语句以及该自然查询语句所对应的一个结构化查询语句组建一条运维数据的训练样本,自然语言查询语句包含有字段,每种字段具有多个属性值;
对于每条训练样本,将自然语言查询语句中出现的每个字段的属性值替换为同种字段的其他属性值,并同样对结构化查询语句做相同替换,由此重复多次形成一批训练样本,完成对训练样本的扩展;
本发明中,自然语言查询语句中的字段是根据数据库中的词典建立字段,利用词典识别自然语言查询语句获得。字段是由单个词或者多个词组成。
(2)针对新型供电城轨列车运行时采集获得的运维数据,对运维数据的自然语言查询和字段进行嵌入处理:
对自然语言查询语句中出现的属于字段属性值的词进行标记,按照不同种字段对应的词映射为不同的类型向量,同一种字段对应的词映射为同一类型向量;同时对自然语言查询语句中每个字段属性值的词处理获得第一词向量;对数据库中每种字段属性值的词的第一词向量进行平均处理获得平均词向量作为该种字段的内容向量,对每个字段的词处理获得第二词向量;
最后将自然语言查询语句中每个类型向量以及数据库中每种字段的内容向量和各自的词向量组合,形成两组输入向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910936345.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、电子设备及存储介质
- 下一篇:一种排序结果索引方法