[发明专利]面向新型供电城轨列车数据运维的自然语言查询解析方法有效
申请号: | 201910936345.0 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110727695B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 吴晓凡;刘晋;潘硕;李辉;田野;陈刚;陈珂;江大伟 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。 | ||
搜索关键词: | 面向 新型 供电 列车 数据 自然语言 查询 解析 方法 | ||
【主权项】:
1.一种面向新型供电城轨列车数据运维的自然语言查询解析方法,其特征在于:方法的步骤如下:/n(1)新型供电城轨列车运行时采集获得的运维数据存储于数据库中,由运维数据的一个自然语言查询语句以及该自然查询语句所对应的一个结构化查询语句组建一条运维数据的训练样本,自然语言查询语句包含有字段,每种字段具有多个属性值;对于每条训练样本,将自然语言查询语句中出现的每个字段的属性值替换为同种字段的其他属性值,并同样对结构化查询语句做相同替换,由此重复多次形成一批训练样本,完成对训练样本的扩展;/n(2)针对新型供电城轨列车运行时采集获得的运维数据,对运维数据的自然语言查询和字段进行嵌入处理:对自然语言查询语句中出现的属于字段属性值的词进行标记,按照不同种字段对应的词映射为不同的类型向量,同一种字段对应的词映射为同一类型向量;同时对自然语言查询语句中每个字段属性值的词处理获得第一词向量;对数据库中每种字段属性值的词的第一词向量进行平均处理获得平均词向量作为该种字段的内容向量,对每个字段的词处理获得第二词向量;最后将自然语言查询语句中每个类型向量以及数据库中每种字段的内容向量和各自的词向量组合,形成两组输入向量;/n(3)将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练,标签是指两组输入向量共同组成的组合对应于结构化查询语句所属部分的分类标签,获得训练后的两个不同神经网络模型;/n(4)将待测试的自然语言查询语句按照上述步骤处理成输入向量,通过训练后的两个不同神经网络模型映射到两个不同的标签空间,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910936345.0/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、电子设备及存储介质
- 下一篇:一种排序结果索引方法