[发明专利]一种驾驶员语音口令识别检测方法在审
申请号: | 202211638533.3 | 申请日: | 2022-12-20 |
公开(公告)号: | CN115985316A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 纪刚;周粉粉;臧强 | 申请(专利权)人: | 青岛联合创智科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F18/10;G06F18/2131;G06F18/24;G10L21/0316;G10L19/02;G10L25/30;G10L25/24;G10L25/48 |
代理公司: | 青岛高晓专利事务所(普通合伙) 37104 | 代理人: | 于正河 |
地址: | 266200 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 驾驶员 语音 口令 识别 检测 方法 | ||
本发明属于公共交通安全保障技术领域,涉及一种驾驶员语音口令识别检测方法;具步骤如下:步骤一:将音频信号转换到频域,进行去噪处理得到语音文件,步骤二:语音特征提取得到声谱特征,步骤三:语音识别模型对声谱特征进行加工识别输出结果数据,步骤四:结果数据对应到由文字库字典获取指定的文字内容,将语音对应的文字内容拼接成一句文字内容语句,该文字内容语句与标准语句内容对比,判断语音口令正确度;所述方法实现了应用模型轻量化、语音识别准确,能够快速发现语音口令中的错误,及时进行更正,保证列车运营安全;本发明能够应用于地铁、火车、轻轨、航空、大型基建设备操作场所及其控制室,具有广阔的应用前景。
技术领域:
本发明属于公共交通安全保障技术领域;涉及一种通过监控列车驾驶员语音口令,对出现的语音错误或者不规范进行检测及时纠正提示的方法;特别是一种驾驶员语音口令识别检测方法,实时检测列车驾驶员执行的语音口令,保障公共交通安全。
背景技术:
为了地铁列车行驶安全,地铁列车驾驶员在工作时,需要执行一些指令并做出相应动作。而目前,需要人工查看分析列车驾驶员动作与口令执行规范性,耗时长、效率低,占用人力资源较多。而且列车驾驶员出现疲劳驾驶或者瞌睡,难以被及时发现。
在现有技术中,公开号为CN115359462A的中国专利,公开了一种公交驾驶员疲劳参数补偿以及双轨并行检测方法,包括:S1、对驾驶员的眨眼、打哈欠的图像数据制定标签;S2、利用人脸关键点算法计算出公交驾驶员在正脸状态下闭眼、张嘴的帧数,并与当前数据预处理方法进行比较,根据比值进行补偿;
S3、疲劳状态时间序列双轨划分;图像帧按时间序列检测完毕后输出各项区域检测结果,结合车速车况按完整时间片段结果划分至双轨时间序列;S4、设定疲劳状态时间序列双轨预警机制;可分析数据包括眨眼帧数、眨眼频率、张嘴帧数、打哈欠次数;定义PERCLOSE计算单位内闭眼帧数与总帧数的比例关系,能反映出眼睛闭合持续时间占检测时间的比值以及驾驶员疲劳状态。公开号为CN112686097A的中国专利,公开了一种人体图像关键点姿态估计方法,包括:对输入的训练图像预处理,用基于空洞卷积的大感受野特征金字塔网络的行人检测网络对输入图像进行检测;将检测到的人体形成的边界框进行裁剪,只保留框内图像;将裁剪后图像输入到设计的模型中,进行人体姿态关键点估计。
及时发现并纠正列车驾驶员不规范的操作行为,对保障公共交通的安全运行极为重要。因此如何快速、准确的发现列车驾驶员存在的驾驶员疲劳、驾驶动作、口令错误等问题,是保障地铁系统安全运行的重要前提,而在现有技术中,列车驾驶员疲劳驾驶的及时发现,列车驾驶员语音口令核验判定等技术依旧不够成熟,且缺少能够实际应用的可靠技术。
发明内容:
本发明的目的在于克服现有技术存在的缺点,针对列车驾驶员存在的驾驶员疲劳、驾驶动作与口令错误等问题,设计一种驾驶员语音口令识别检测方法,能够快速发现列车驾驶员语音口令错误,保障乘客乘车安全。
为了实现上述目的,本发明涉及的一种驾驶员语音口令识别检测方法,具步骤如下:
步骤一:预处理
对采集到的声音信号进行预处理,将驾驶员说出的语音口令从原始信号中提取出来;对采集的语音进行去噪:首先使用短时傅里叶变换将音频信号转换到频域,采用小波去噪算法对收集的语音信息进行去噪处理,得到语音文件;步骤二:语音特征提取
读取语音文件,得到声音信号的时域谱矩阵x(t);对语音文件数据进行分帧和汉明窗处理得到数据为x(frame_len,N),N为帧的数量,其中设置25ms为一帧,每一帧的长度设置为frame_len=400,同时为保证帧与帧之间平滑过渡保持连续性,设置帧与帧之间的重叠长度overlap_len=160;对N帧进行循环处理,每一帧进行汉明窗处理后,进行快速傅里叶变换得到频域数据的振幅,这样每一帧处理后的数据在时间上堆叠起来就能够得到声谱特征;
步骤三:语音识别模型对声谱特征进行加工识别
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛联合创智科技有限公司,未经青岛联合创智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211638533.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种辣椒的种植方法
- 下一篇:一种低氧铝钼钨钛中间合金及其制备方法