[发明专利]基于深度学习的列车广播语音增强方法和系统有效
申请号: | 202210099789.5 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114121033B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李跃群;张有利 | 申请(专利权)人: | 深圳市北海轨道交通技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/30 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 商金婷 |
地址: | 518000 广东省深圳市宝安区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 列车 广播 语音 增强 方法 系统 | ||
1.一种基于深度学习的列车广播语音增强方法,其特征在于,包括:
获取车载PIS系统的列车运行信息;
识别列车运行信息,确定列车实时场景;
所述识别列车运行信息,确定列车实时场景包括:
当列车运行信息识别为视频信息,则对视频信息做图像识别,识别统计实时人流量,并判断是否超出高峰人流阈值或低于低峰人流阈值,如果是,则判定为高峰人流场景 或低峰人流场景;
从预设的数据库中读取列车实时场景所匹配的声学均衡参数;
获取车载PIS系统的音频流;以及,
基于声学均衡参数,以预设的中控声效算法对音频流处理,同时调整声音感受位置,并发送处理后音频流至车载PIS系统用作播放。
2.根据权利要求1所述的基于深度学习的列车广播语音增强方法,其特征在于,所述中控声效算法包括:
信号预处理,其包括将音频流做满足FPU计算的归一化处理;
均衡处理,其包括划分10个频率段,以所述声学均衡参数对划分后的10个频率段分别做均衡,调整增益,并进行混音处理;其中,各个频率段的中心频点分别为32、64、128、256、512、1k、2k、4k、8k、16k;
回响处理,其包括对音频中的原始声音衰减复制,复制至相应的音频位置与原后续音频进行混音。
3.根据权利要求2所述的基于深度学习的列车广播语音增强方法,其特征在于:所述划分10个频率段包括:以IIR带通滤波器对音频流做频率段划分处理。
4.根据权利要求2所述的基于深度学习的列车广播语音增强方法,其特征在于:所述调整增益包括:每段的调整幅度为-12dBm至12dBm。
5.根据权利要求1所述的基于深度学习的列车广播语音增强方法,其特征在于:所述识别列车运行信息,确定列车实时场景包括:
当列车运行信息识别为速度信息,且为0-Xkm/H,则判定为启动场景; X-0KM/H,则判定为停靠场景;其他则判定运行场景;其中,X为低速阈值;
当列车运行信息识别为指定识别信息,则判定为预匹配的指定场景。
6.根据权利要求1所述的基于深度学习的列车广播语音增强方法,其特征在于,还包括:
记录过程信息,绑定时间参数,存为音频改造档案;
利用音频改造档案训练预设的神经网络模型;
以训练后的神经网络模型识别后续的实时音频流,如果存在记录,且列车当前环境匹配记录信息,则调取记录中的处理后音频流发送至车载PIS系统用作播放。
7.一种基于深度学习的列车广播语音增强系统,其特征在于:包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至6中任一种基于深度学习的列车广播语音增强方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市北海轨道交通技术有限公司,未经深圳市北海轨道交通技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210099789.5/1.html,转载请声明来源钻瓜专利网。