[发明专利]针对民航陆空通话领域的中英文语种语音识别方法及系统有效
申请号: | 201810905662.1 | 申请日: | 2018-08-10 |
公开(公告)号: | CN108986791B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 杨群;周凯;刘绍翰;王佳文 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/00;G10L25/24 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王戈 |
地址: | 210000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 民航 陆空 通话 领域 中英文 语种 语音 识别 方法 系统 | ||
本发明公开一种针对民航陆空通话领域的中英文语种语音识别方法及系统。方法包括:获取民航陆空通话语音的数据集,包括音频文件、标注文本、发音词典、语言模型,作为训练数据集;对所述训练数据集进行特征提取,并对所述数据转换得到特征向量;根据所述特征向量进行语种识别训练,得到中英文语种识别模型;根据所述特征向量进行语音识别训练,得到中英文语音识别模型;将所述语种识别模型作为前端、所述语音识别模型作为后端得到民航空中交通管制中英文语种语音识别方法。采用本发明的方法或者系统能够辅助管制员进行陆空对话分析,保证语音识别的精确度,提高民航陆空通话的准确性。
技术领域
本发明涉及智能通话领域,特别是涉及一种针对民航陆空通话领域的中英文语种语音识别方法及系统。
背景技术
由于航空运输、通用航空和军事交通的迅速发展,使得空中交通管制(AirTraffic Control,ATC)系统的运行繁忙,空中交通管制的工作强度大、工作时间长,从而导致管制员工作疲劳、精神不振,容易在通话中发出不当甚至错误的指令。
世界范围内的许多空难事故都是由于陆空通话失误而产生的。在1977年,在特纳利夫(Tenerife)岛上发生了民航历史中最为严重的空难,造成了583名乘客全部死亡。而这次空难是由于飞行员与管制员通话时使用了不当的飞行指令所导致的。
民航陆空通话作为飞行员与管制员之间的一种重要的通信方式,其正确性是保障航空器安全、高效运行的关键。也是关系民航事业发展的重点。为了减少陆空通话失误的发生,国际民航组织不断地对陆空通话用语规范进行改进,但是由于陆空通话失误导致的飞行事故仍然不断发生,这对民航安全提出了严峻的考验。
民航陆空通话依赖于管制员主观性的决策,是高强度的脑力劳动,这对管制员的可靠性要求极高,如果能通过机器来辅助管制员甚至替代管制员进行陆空通话,将能有效提高ATC系统的性能和可靠性,这对减少陆空安全事故具有重大和迫切的现实意义。
近些年,语音识别技术已日益成熟,使得实现以上构想成为可能,因此,因此,如何提供一种针对民航陆空通话领域的中英文语种语音识别方法及系统,成为本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种针对民航陆空通话领域的中英文语种语音识别方法及系统,提高民航陆空通话的准确性。
为实现上述目的,本发明提供了如下方案:
一种针对民航陆空通话领域的中英文语种语音识别方法,所述识别方法包括:
获取民航陆空通话语音的数据集,包括音频文件、标注文本、发音词典、语言模型,作为训练数据集;
对所述训练数据集进行特征提取,并对所数据转换得到特征向量;
根据所述特征向量进行中英文语种识别训练,得到中英文语种识别模型;
根据所述特征向量进行语音识别训练,得到中英文语音识别模型;
将所述中英文语种识别模型作为前端、所述中英文语音识别模型作为后端得到民航陆空通话中英文语种语音识别方法。
可选的,对所述训练数据集进行特征提取,并对所数据转换转换得到特征向量,具体包括:
找到一段语音端点,去除掉语音前部无声或噪音片段,仅保留包含有人说话的片段;
若所述语音过长,则以较短时间间隔切分所述语音,得到语音段;
对所述语音段进行特征提取,选用梅尔倒谱频率特征,得到特征向量;
对所述特征向量进行针对民航陆空对话特点的适应转换,所述转换包括噪音削减、音速扰动,得到处理后的特征向量。
可选的,所述根据所述特征向量进行语种识别训练,得到语种识别模型,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810905662.1/2.html,转载请声明来源钻瓜专利网。