[发明专利]一种针对少量标注样本的空管语音识别方法及装置有效

专利信息
申请号: 202010663698.0 申请日: 2020-07-10
公开(公告)号: CN111785257B 公开(公告)日: 2022-08-26
发明(设计)人: 林毅;杨波;张建伟 申请(专利权)人: 四川大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/16;G10L15/22;G10L15/26;G08G5/00
代理公司: 四川力久律师事务所 51221 代理人: 冯精恒
地址: 610065 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 少量 标注 样本 语音 识别 方法 装置
【说明书】:

发明涉及民用航空空中交通管制和语音识别领域,特别是一种针对少量标注样本的空管语音识别方法及装置。本发明基于神经网络运用未标注数据训练识别模型主干网络,且能够在少量标注样本情况下得到识别准确度好,效率高的空管语音识别模型,并能在输入空管语音后基于该空管语音识别模型准确快速的输出对应的空管指令文本信息,提高空管语音识别技术应用的可用性和新场景下的可扩展性。

技术领域

本发明涉及民用航空空中交通管制和语音识别领域,特别是一种针对少量标注样本的空管语音识别方法及装置。

背景技术

在现有的空管管制体制下,空中交通管制员基于自动化系统提供的交通态势信息(包括监视信息、飞行计划、气象信息等)进行管制决策。管制员通过甚高频(VHF)无线电电台与飞行员语音通话以引导其责任扇区内的航班安全有序地飞行。管制通话是空管闭环中“人在环路”(human-in-the-loop,HITL)的集中体现,非常有必要进行实时监控以提高管制指挥和航班运行安全。因此,作为管制员和自动化系统之间的衔接桥梁,空管语音识别研究具有重大的现实意义。

作为典型的有监督学习任务,语音识别性能高度依赖特定应用场景下的已标注训练语料。语料中训练样本的数量、特征多样性和词汇覆盖度极大地影响语音识别模型的最终性能。在通用语音识别研究中,现有模型的训练语料一般在几千小时。但是,由于关系民航安全问题,不易搜集足够的管制通话语音数据支持空管语音识别研究。此外,民航管制过程中要求管制员必须使用特殊规范用语,其中包含共性的空管知识,例如发音转义(0-洞、7-拐)、专业术语(修正海压、RNAV)、航空公司(国航、四川)以及高度层等,使得空管语音识别样本标注更加地依赖于空管领域知识,对标注人员具有一定要求,且较通用语音识别标注更加的费时费力。因此,语料缺乏、特别是标注语料样本的缺乏是空管语音识别研究面临的现实问题。

空中交通管制包括放行、塔台、进近和区管等多个阶段,各个阶段的管制通话语音使用相似的专业术语通话(如数字发音),同时也具有较多与地域和管制业务相关的独特性。例如,与管制区域相关的术语:“PIKAS”仅能出现在成都区域管制中心的管制通话中;与管制业务相关的术语:“起飞”仅能出现在塔台管制阶段的管制通话中。由于空管语音样本的特殊性,针对所有区域、业务标注足够的训练样本支撑语音识别研究需要大量的人力、物力和财力,在实际应用过程中也是不太现实的。因此,基于子域知识的模型迁移技术是实现高性能空管语音识别必要的研究内容。

鉴于上述问题,非常有必要研究样本缺乏下的空管语音识别方法和模型及其在不同口音、区域和管制业务上的迁移问题,提高空管语音识别技术在应用和工程上的可用性以及可扩展性。

发明内容

本发明的目的在于:针对现有技术存在的少量标注样本情况下空管语音识别准确度差,效率低下的问题,提供一种针对少量标注样本的空管语音识别方法及装置,其中,所述标注样本为包含指令文本信息的样本。

为了实现上述目的,本发明采用的技术方案为:

一种针对少量标注样本的空管语音识别方法,包括以下步骤:

a:采集空管语音并对所述空管语音进行预处理,得到梅尔频率倒谱系数特征图;

b:将所述梅尔频率倒谱系数特征图输入到预先建立的空管语音识别模型;

c:输出所述空管语音对应的指令文本信息;

所述标注样本为包含指令文本信息的样本,所述空管语音识别模型包括主干网络和全连接预测层;所述主干网络采用降噪自编码器模型网络进行无监督预训练得到;所述全连接预测层用于优化模型参数。本发明基于数据压缩思想,能够在少量标注样本情况下得到识别准确度好,效率高的空管语音识别模型,并能在输入空管语音后基于该空管语音识别模型准确快速的输出对应的指令文本信息,提高空管语音识别技术应用的可用性和新场景下的可扩展性。

作为本发明的优选方案,所述空管语音识别模型的训练包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010663698.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top