[发明专利]基于深度学习的列车广播语音增强方法和系统有效
申请号: | 202210099789.5 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114121033B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李跃群;张有利 | 申请(专利权)人: | 深圳市北海轨道交通技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/30 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 商金婷 |
地址: | 518000 广东省深圳市宝安区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 列车 广播 语音 增强 方法 系统 | ||
本发明公开了一种基于深度学习的列车广播语音增强方法和系统,其方法包括获取车载PIS系统的列车运行信息;识别列车运行信息,确定列车实时场景;从预设的数据库中读取列车实时场景所匹配的声学均衡参数;获取车载PIS系统的音频流;以及,基于声学均衡参数,以预设的中控声效算法对音频流处理,同时调整声音感受位置,并发送处理后音频流至车载PIS系统用作播放。本申请具有能结合列车不同运营场景自动切换声场均衡参数,动态增加声场的效果。
技术领域
本申请涉及音频处理技术领域,尤其是涉及一种基于深度学习的列车广播语音增强方法和系统。
背景技术
对于列车而言,其站点播报、消息通知等均需要通过广播进行通知。然而,在列车运行过程中,除了内部乘客发出的噪声外,还有列车外部的风噪、机械噪声等,干扰了语音播报效果。
申请号为CN201710105745.8的专利一种基于ARM+FPGA架构的列车语音放大单元,该列车语音放大单元包括主控制模块、编解码放大模块和通信模块三部分。主控制模块包括主控芯片及外围器件,负责系统的初始化、音频存储与处理,以及运行应用程序和AGC、限幅限频算法。编解码放大模块包括编解码子模块、功放子模块和检测子模块,负责对各种格式的音频信号进行处理与放大,同时实现电流检测以及音频降级功能。通信模块包括两路千兆以太网和RS485及RS232总线,负责音频与噪检信号传输。各功能模块协调工作,构成了完整的语音放大单元。
上述技术方案给出了一种用于列车使用环境的音频芯片,但是其无法结合地铁列车乘客信息系统的相关信息,对不同运营场景自动切换声场均衡参数,动态增加声场,因此本申请提出一种新的技术方案。
发明内容
为了能结合列车不同运营场景自动切换声场均衡参数,动态增加声场,本申请提供一种基于深度学习的列车广播语音增强方法和系统。
第一方面,本申请提供一种基于深度学习的列车广播语音增强方法,采用如下的技术方案:
一种基于深度学习的列车广播语音增强方法,包括:
获取车载PIS系统的列车运行信息;
识别列车运行信息,确定列车实时场景;
从预设的数据库中读取列车实时场景所匹配的声学均衡参数;
获取车载PIS系统的音频流;以及,
基于声学均衡参数,以预设的中控声效算法对音频流处理,同时调整声音感受位置,并发送处理后音频流至车载PIS系统用作播放。
可选的,所述中控声效算法包括:
信号预处理,其包括将音频流做满足FPU计算的归一化处理;
均衡处理,其包括划分10个频率段,以所述声学均衡参数对划分后的10个频率段分别做均衡,调整增益,并进行混音处理;其中,各个频率段的中心频点分别为32、64、128、256、512、1k、2k、4k、8k、16k;
回响处理,其包括对音频中的原始声音衰减复制,复制至相应的音频位置与原后续音频进行混音。
可选的,所述划分10个频率段包括:以IIR带通滤波器对音频流做频率段划分处理。
可选的,所述调整增益包括:每段的调整幅度为-12dBm至12dBm。
可选的,所述识别列车运行信息,确定列车实时场景包括:
当列车运行信息识别为速度信息,且为0-Xkm/H,则判定为启动场景; X-0KM/H,则判定为停靠场景;其他则判定运行场景;其中,X为低速阈值;
当列车运行信息识别为指定识别信息,则判定为预匹配的指定场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市北海轨道交通技术有限公司,未经深圳市北海轨道交通技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210099789.5/2.html,转载请声明来源钻瓜专利网。