[发明专利]一种基于机载设备的特定说话人启动人脸识别方法在审
申请号: | 201911251982.0 | 申请日: | 2019-12-09 |
公开(公告)号: | CN113035173A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 吴云清;李曜;吴沛文 | 申请(专利权)人: | 上海航空电器有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/05;G10L15/06;G10L15/26;G10L25/78;G06K9/00 |
代理公司: | 上海世圆知识产权代理有限公司 31320 | 代理人: | 顾俊超 |
地址: | 201101 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机载 设备 特定 说话 启动 识别 方法 | ||
1.一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,包含有以下步骤,
步骤S1,采集特定飞行员语音数据与其他说话人的孤立词条语音数据;
步骤S2,采用端点检测、预加重、分帧加窗语音数据前端处理;
步骤S3,提取12维MFCC特征向量;
步骤S4,设计并训练特定飞行员语音模型和语音内容识别模型;
步骤S5,将测试语音数据的MFCC特征信息送入到特定飞行员语音识别模型与语音内容识别模型进行计算打分;以及,
步骤S6,识别出特定人与语音内容后启动人脸识别设备。
2.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,所述步骤S1中采集数据集操作方法,包含有,
步骤S11,室内环境下采集N名待实验飞行员语音数据,语音内容至少有:启动身份认证,确认及飞行控制相关指令,N为大于1的整数;
步骤S12,室内环境下采集其他说话人的语音数据,语音内容与步骤S11相同;
步骤S13,在空中飞行环境中采集带有噪音的语音数据集,语音内容与步骤S11相同。
3.根据权利要求2所述的一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,所述采集数据集必须包括模拟飞行环境和室内环境下的语音数据,且占比不低于0.2。
4.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,所述步骤S3中MFCC特征提取的方法,包含有,
步骤S31,经端点检测、预加重、分帧和加窗操作后,使用基为2的FFT算法对每一帧语音进行快速傅里叶变换;
步骤S32,计算实部和虚部得到平方和后,然后采用可消除谐波作用的三角窗滤波器得到输出能量;
步骤S33,人耳感受到的音调与声音的频率成对数关系,计算各个滤波器组输出的对数能量;
步骤S34,经离散余弦变换(DCT)得到12维的MFCC特征信息,并在语音特征中加入其一阶差分倒谱和二阶差分倒谱。
5.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,所述步骤S4中设计特定飞行员语音模型和语音内容模型的方法,包含有,
步骤S41,利用其他说话人和飞行员的语音数据集训练可用于语音内容识别的隐马尔科夫模型;
步骤S42,利用特定飞行员的语音数据集设计并训练N个待测特定飞行员的GMM-UBM语音模型,其中步骤S41训练的语音内容识别模型充当GMM-UBM中的UBM;
步骤S43,利用特征语音自适应技术,并结合步骤S41、S42可实现特定飞行员身份与语音内容的同时识别。
6.根据权利要求1所述的一种基于机载设备的特定说话人启动人脸识别方法,其特征在于,所述步骤S5中识别出特定人与语音内容后启动人脸识别设备的方法,包含有,
步骤S51,识别出特定人信息和语音内容是启动身份认证后,自动打开摄像头开始人脸识别,进行2次身份认证;
步骤S52,拍摄待测飞行员的头像,并提取头像特征;
步骤S53,启动已训练好的人脸识别模型进行人脸比对,确认是否为该飞行员;
步骤S54,是,则可以发动引擎;否,则无法启动飞行器引擎。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航空电器有限公司,未经上海航空电器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911251982.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电动收紧装置的控制方法
- 下一篇:军用战术手语到汉语语音转换方法