[发明专利]一种机载空管指令智能语音识别方法与系统在审
申请号: | 202111518350.3 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114512131A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 李博;徐舒寒;张炯;杨志刚 | 申请(专利权)人: | 中国商用飞机有限责任公司北京民用飞机技术研究中心;中国商用飞机有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/08;G10L15/22;G10L13/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 皋吉甫 |
地址: | 102211 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机载 指令 智能 语音 识别 方法 系统 | ||
1.一种机载空管指令智能语音识别方法,其特征在于,所述方法包括:空管端语音处理过程和飞行员语音处理过程;
所述空管端语音处理过程包括:
S11、采集空管人员的空管语音数据;
S12、利用训练好的语音模型对所述空管语音数据进行处理,得到空管语音标注文本;
S13、利用训练好的语言模型对所述空管语音标注文本进行处理,提取出若干空管指令关键词并组合成空管指令关键词文本;
S14、对所述空管指令关键词文本进行语音合成并传输给飞行员接听,同时将所述空管指令关键词文本传输给机载端显示设备进行显示;
所述飞行员语音处理过程包括:
S21、采集飞行员的飞行员语音数据;
S22、利用训练好的语音模型对所述飞行员语音数据进行处理,得到飞行员语音标注文本;
S23、利用训练好的语言模型对所述飞行员语音标注文本进行处理,识别出若干飞行员指令关键词并组合成飞行员指令关键词文本;
S24、根据所述飞行员指令关键词文本的内容触发通信设备、导航设备和/或检查单设备进行响应,完成和空管端的通信功能、飞机机体动作调整功能和/或项目检查功能。
2.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,步骤S12和步骤S22中的语音模型的训练内容包括:采集历史语音数据,根据航空专业术语以及各字词的声调对历史语音数据进行标记得到用于模型训练的语音标注文本,并输入原始模型中进行训练,得到训练好的所述语音模型;
所述原始模型为基于语谱图图像卷积神经网络与连接时序分类模型相结合的神经网络模型,将时间和频率作为图像的两个维度,通过较多的卷积层和池化层的组合,实现原始建模。
3.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,步骤S12中的所述空管语音标注文本和步骤S22中的所述飞行员语音标注文本均包括:航空专业术语修订后的中文分词语料文本、带有声调标记的汉语拼音文本以及将汉语拼音分解为辅音和元音因素的最小语音单元序列。
4.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,步骤S13和步骤S23中的语言模型为基于自注意力机制的深度学习模型。
5.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,步骤S11中的空管语音数据和步骤S21中的飞行员语音数据为音频文件或语音频谱图。
6.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,所述方法还包括:根据空管语音处理过程中的所述空管语音数据和所述空管语音标注文本以及飞行员语音处理过程中的所述飞行员语音数据和所述飞行员语音标注文本对飞行语音语料库进行扩充。
7.根据权利要求6所述的机载空管指令智能语音识别方法,其特征在于,对飞行语音语料库进行扩充的具体内容包括:以待判断数据为模板对飞行语音语料库进行遍历,判断飞行语音语料库中是否有相同的数据,若有,则终止此次扩充;否则,将待判断数据补充进飞行语音语料库,并进入步骤S12或步骤S22。
8.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,
步骤S12和步骤S22中对语音数据进行处理后更新对应语音模型的参数配置文件;
步骤S13和步骤S23中对语音标注文本进行处理后更新对应语言模型的参数配置文件。
9.根据权利要求1所述的机载空管指令智能语音识别方法,其特征在于,机载端语音模型和语言模型的参数配置文件和空管端语音模型和语言模型的参数配置文件之间实时同步,实现机载端模型的自动更新。
10.一种机载空管指令智能语音识别系统,其特征在于,所述系统能够实现如权利要求1-9任一所述的方法的步骤;
所述系统包括:
机载端,其包括:语音采集处理模块、语音模型模块、语言模型模块、检查单系统、导航响应系统和通信响应系统;所述语音采集处理模块、所述语音模型模块、所述语言模型模块依次连接,且所述语言模型通过接口分别与所述检查单系统、所述导航响应系统以及所述通信响应系统连接;
空管端,其包括:语音采集处理模块、语音模型模块和语言模型模块;所述语音采集处理模块、所述语音模型模块和所述语言模型模块依次连接;
所述机载端与所述空管端通信连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国商用飞机有限责任公司北京民用飞机技术研究中心;中国商用飞机有限责任公司,未经中国商用飞机有限责任公司北京民用飞机技术研究中心;中国商用飞机有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111518350.3/1.html,转载请声明来源钻瓜专利网。