[发明专利]飞行员口音个性化模型生成方法及系统在审
申请号: | 202011389357.5 | 申请日: | 2020-12-02 |
公开(公告)号: | CN114596837A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 李曜;蒲毅;吴沛文;李瑞敏 | 申请(专利权)人: | 上海航空电器有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26;G10L15/30 |
代理公司: | 上海世圆知识产权代理有限公司 31320 | 代理人: | 顾俊超 |
地址: | 201101 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 飞行员 口音 个性化 模型 生成 方法 系统 | ||
本发明公开飞行员口音个性化模型生成方法,包含有以下步骤,在带有目标飞行员口音的机载语音库中提取目标飞行员的口音特征,所述口音特征包含有口音信息;在带有目标飞行员口音的机载语音库中提取目标飞行员的声学特征,所述声学特征包含有语音信息;拼接所述口音特征与所述声学特征以获得拼接特征,所述拼接特征包含有口音信息及语音信息;以及,在通用语音识别模型中,使用所述拼接特征进行个性化模型训练以获得目标飞行员的口音个性化模型。本发明的有益效果在于:降低飞行员口音差异带来的影响,提升机载语音识别系统在口音方面的鲁棒性。
技术领域
本发明涉及机载语音识别领域,特别地是,飞行员口音个性化模型生成方法及系统。
背景技术
在军用航空领域,战场态势瞬息万变,飞行员操作负荷较大。将语音识别技术引入机载座舱,可以将飞行员的肢体操作控制转变为语音智能操控模式,大大减少操控频率,提高操控效率,有效降低飞行员操作负荷,提升任务执行效能。然而飞行员的语音输入可能存在口音,且口音多样,语言习惯差异大,通用语音识别模型识别率低。
发明内容
本发明目的是解决现有技术中通用语音识别模型对口音识别率较低的问题,而提供一种新型的飞行员口音个性化模型生成方法及系统。
为了实现这一目的,本发明的技术方案如下:飞行员口音个性化模型生成方法,包含有以下步骤,
在带有目标飞行员口音的机载语音库中提取目标飞行员的口音特征,所述口音特征包含有口音信息;
在带有目标飞行员口音的机载语音库中提取目标飞行员的声学特征,所述声学特征包含有语音信息;
拼接所述口音特征与所述声学特征以获得拼接特征,所述拼接特征包含有口音信息及语音信息;以及,
在通用语音识别模型中,使用所述拼接特征进行个性化模型训练以获得目标飞行员的口音个性化模型。
本发明还提供飞行员口音个性化模型生成系统,包含有
用户管理模块,其用于管理用户权限;
词条管理模块,其用于选择要测试的词条,与后面模型测试时作对照;
音频管理模块,其用于接收音频数据并存储到本地,为后面模型训练提供数据基础;
模型训练模块,其用于对音频数据进行训练,生成新的声学模型;
模型测试模块,其用新生成的声学模型和老的声学模型分别对用户的音频数据进行测试,判断模型是否有效;
模型管理模块,其用于导出模型;以及,
以太网通信模块,其用于负责以上六个模块与存储设备之间的通信,包括接收使能控制信号、发送语音识别指令结果、传输音频数据,并支持软件在线升级、模型升级和词条扩展。
与现有技术相比,本发明的有益效果至少在于:采用飞行员口音特征提取、声学特征提取、声学模型训练、个性化模型训练等技术,构建机载专用的飞行员口音个性化声学模型,从而降低飞行员口音差异带来的影响,提升机载语音识别系统在口音方面的鲁棒性。
附图说明
图1为本发明的方法流程图。
图2为本发明的结构示意图。
具体实施方式
下面通过具体的实施方式连接附图对本发明作进一步详细说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
请参见图1,图中示出的是飞行员口音个性化模型生成方法,步骤描述如下:
步骤1,从带有目标飞行员口音的机载语音库中提取飞行员口音特征。
步骤2,从带有目标飞行员口音的机载语音库中提取包含语音信息的声学特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航空电器有限公司,未经上海航空电器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011389357.5/2.html,转载请声明来源钻瓜专利网。