[发明专利]一种基于BiLSTM-Attention的陆空通话复诵语义自动校验方法在审
申请号: | 202010042043.1 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111274784A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 贾桂敏;李丹 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/253;G06F40/289;G06F40/30;G06F16/33;G06N3/04 |
代理公司: | 天津才智专利商标代理有限公司 12108 | 代理人: | 庞学欣 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bilstm attention 陆空 通话 复诵 语义 自动 校验 方法 | ||
1.一种基于BiLSTM-Attention的陆空通话复诵语义自动校验方法,其特征在于:所述的基于BiLSTM-Attention的陆空通话复诵语义自动校验方法包括按顺序进行的下列步骤:
步骤1)制作中英文陆空通话复诵语料库;
步骤2)对上述中英文陆空通话复诵语料库进行预处理,获得每一陆空通话复诵语句对中两个语句的词向量序列;
步骤3)将上述每一陆空通话复诵语句对中两个语句的词向量序列分别输入到两个并列的BiLSTM网络中,得到BiLSTM网络输出的陆空通话复诵语句对的特征向量;
步骤4)在BiLSTM网络输出层后添加Attention层,对上述BiLSTM网络输出的陆空通话复诵语句对的特征向量进行权重分配,最后得到管制员发送的指令语句语义特征向量Vp和飞行员的复诵语句语义特征向量VATC;
步骤5)将上述管制员发送的指令语句语义特征向量Vp和飞行员的复诵语句语义特征向量VATC进行拼接,并将拼接后的语句语义特征向量输入到多层感知器中,得到语句对的匹配分数和复诵一致或者不一致的分类结果。
2.根据权利要求1所述的基于BiLSTM-Attention的陆空通话复诵语义自动校验方法,其特征在于:在步骤1)中,所述的制作中英文陆空通话复诵语料库的方法是:
步骤1.1)将真实的陆空通话录音转换为文本形式,并参照民航空管陆空通话标准,从中挑选出复诵类型的语句对作为陆空通话复诵语句对,每个复诵语句对分别由管制员发送的指令和飞行员的复诵两个语句组成,然后将其存储为文本txt格式;
步骤1.2)依据《空中交通管制员无线电陆空通话》中的陆空通话规则及民航局相关要求,将上述陆空通话复诵语句对作为样本并进行正负样本标注,将其中复诵正确的陆空通话复诵语句对标注为正样本,设置标签为1;将复诵错误的陆空通话复诵语句对标注为负样本,设置标签为0;由所有正负样本构成陆空通话复诵语料库;
步骤1.3)对样本进行校验;所述的陆空通话复诵语料库包括中文陆空通话复诵语料库和英文陆空通话复诵语料库。
3.根据权利要求1所述的基于BiLSTM-Attention的陆空通话复诵语义自动校验方法,其特征在于:在步骤2)中,所述的对上述中英文陆空通话复诵语料库进行预处理,获得每一陆空通话复诵语句对中两个语句的词向量序列的方法是:
步骤2.1)对中文陆空通话复诵语料库进行预处理,包括中文分词、制作词表和生成词向量;中文分词是将语句分割为词序列形式;然后对分好词的中文陆空通话复诵语料库中的所有词进行统计而得到中文陆空通话复诵专用词表;依据上述得到的中文陆空通话复诵专用词表,训练生成其one-hot和word2vec两种词向量,得到每个语句的词向量序列;
步骤2.2)对英文陆空通话复诵语料库进行预处理,包括词干提取、转化为小写、制作词表和生成词向量;词干提取过程是去掉词缀得到词根的过程,即要找到词的原始形式,将不同形式的词映射为一个相同的词干;使用的词干提取方法是PYTHON中的NLTK库自带的stemming算法;将词干提取后的英文陆空通话复诵语料库中的文本全部转化为小写,使其不会因大小写原因而影响复诵校验任务;然后对转化为小写后的英文陆空通话复诵语料库中的所有词进行统计而得到英文陆空通话复诵专用词表;最后,依据上述得到的英文陆空通话复诵专用词表,训练生成其one-hot和word2vec两种词向量,得到每个语句的词向量序列;
因此,得到管制员发送的指令序列和飞行员的复诵序列其中xi为第i个词的词向量,L1、L2分别为管制员发送的指令和飞行员的复诵的语句长度,将所有语句的最长长度N作为输入语句的长度,小于该语句长度的语句使用补零方法补齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010042043.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于郫县豆瓣的辣椒品种选育方法
- 下一篇:一种详细化学反应机理的简化方法