[发明专利]一种基于声音识别的地铁站台安全监测方法在审
申请号: | 202011246625.8 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112349296A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 杨霞;胡添杰 | 申请(专利权)人: | 胡添杰 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51;B61B1/02 |
代理公司: | 济南鼎信专利商标代理事务所(普通合伙) 37245 | 代理人: | 贾国浩 |
地址: | 063000 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声音 识别 地铁 站台 安全 监测 方法 | ||
1.一种基于声音识别的地铁站台安全监测方法,其特征在于,包括声音采集步骤和声音识别步骤,
所述声音采集步骤包括步骤:
S11、在站台不同区域安装声音采集装置,每个声音采集装置都有位置标记;
S12、利用声音采集装置实时采集周围的声音;
S13、过滤掉声音采集装置所采集的声音中的地铁站播报的声音后,将过滤后的声音发送至声音识别步骤;
所述声音识别步骤包括步骤:
S21、收集各种正常情况下地铁站台的声音,建立正常声音数据集;
S22、收集和呼救声、突发事件有关的关键字声音,建立异常呼救声音数据集;
S23、搭建具有呼救语音识别模型的声音识别器,所述呼救语音识别模型包括特征提取、声学模型、语言模型以及字典与解码;
S24、训练呼救语音识别模型,使用异常呼救声音数据集和正常声音数据集两个字典集,将已经标记了所属声音类别的声音数据作为训练样本,提取声学特征MFCC,把每一帧波形变成一个包含声音信息的多维特征向量,向基于深度神经网络模型输入特征向量,输出音素信息,根据声学特性计算每一个特征向量在声学特征上的得分,进而识别出呼救声和风险等级;
S25、利用声音识别器识别声音采集装置传输的声音,当识别出呼救声音或突发事件声音时,选择获取异常声音最大的声音采集装置的位置作为距离异常事发地最近的位置,将这个位置和异常声音发送给司机和相关工作人员,并提供识别出的声音的风险等级。
2.根据权利要求1所述的一种基于声音识别的地铁站台安全监测方法,其特征在于:所述正常声音数据集包括乘客的嘈杂声、火车进出站的声音、地铁站语音播报的声音。
3.根据权利要求1所述的一种基于声音识别的地铁站台安全监测方法,其特征在于:所述异常呼救声音数据集包括分贝突然变大的声音,对于分贝突然变大的声音,呼救语音识别模型不再识别异常声音的语义,而是仅判断其与正常声音特征的相似度,如果差异性很大,则可识别为异常声音。
4.根据权利要求1所述的一种基于声音识别的地铁站台安全监测方法,其特征在于:所述突发事件有关的声音包括尖叫声、爆炸声、争吵声、摔打声。
5.根据权利要求1所述的一种基于声音识别的地铁站台安全监测方法,其特征在于:所述语音识别模型的语言模型采用循环神经网络模型。
6.根据权利要求5所述的一种基于声音识别的地铁站台安全监测方法,其特征在于:所述循环神经网络模型为RNN或LSTM,所述循环神经网络模型先将收集到的用于训练的声音切分成固定时长的语音段落,并提取每个语音段落的MFCC特征参数,然后将MFCC特征参数经过特征归一化处理计算后输入网络模型进行训练,训练将输出损失降低到目标范围内,完成训练后得到语音识别声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡添杰,未经胡添杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011246625.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土水化温升抑制剂及其制备方法
- 下一篇:柔性接头成型方法