[发明专利]一种抗噪声的移动巡检语音语义识别系统在审
申请号: | 202111315295.8 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114171017A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 赵轩;徐涛;彭冲;张四维;武永泉;李懂理;许洪华 | 申请(专利权)人: | 国网江苏省电力有限公司南京供电分公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F40/30;G10L15/02;G10L15/16;G10L15/20;G10L21/0208 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 朱戈胜 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 噪声 移动 巡检 语音 语义 识别 系统 | ||
1.一种抗噪声的移动巡检语音语义识别系统,其特征在于:包括
音频采集模块实现音频信息的采集;
音频检测模块实现对音频信息的检测标注,得到语音数据和噪音数据;
音频降噪模块实现对语音数据的降噪;
语义识别模块实现对降噪后语音数据的语义识别。
2.根据权利要求1所述的抗噪声的移动巡检语音语义识别系统,其特征在于:音频采集模块保持常开,连续采集附近音频信息,并将每1秒采集的音频信息传输给音频检测模块。
3.根据权利要求1所述的抗噪声的移动巡检语音语义识别系统,其特征在于:音频检测模块检测音频信息是否有语音输入,如果未检测到语音输入,则将音频信息保存并标记为噪音数据;如果检测到有语音输入,则将音频信息保存并标记为语音数据;
检测到语音数据后,将存储的所有所述的噪音数据以及所述的语音数据传输给音频降噪模块。
4.根据权利要求3所述的抗噪声的移动巡检语音语义识别系统,其特征在于:音频检测模块保存10秒长度的所述噪音数据,每次保存最新一段所述的噪音数据都覆盖最早的一段所述的噪音数据。
5.根据权利要求1所述的抗噪声的移动巡检语音语义识别系统,其特征在于:音频降噪模块将所述的语音数据进行降噪处理,得到生成语音数据,再将生成语音数据传入语义识别模块;具体步骤包括:
步骤1、分别将所述的噪音数据与所述的语音数据以等时间间隔为切点,切分成若干个音频数据块;
步骤2、将每个所述的音频数据块转换成相对应的数字矩阵,并进行归一化处理,得到噪音数字数据和语音数字数据;
步骤3、将所述的噪音数字数据和所述的语音数字数据进行拼接,再将拼接后的数字矩阵传入已经训练好的语音生成模型中,得到生成语音数据。
6.根据权利要求5所述的抗噪声的移动巡检语音语义识别系统,其特征在于:语音生成模型包括2个下采样结构和1个上采样结构,其中每个下采样结构包括3个下卷积层,上采样结构包括3个反卷积层;
其中一个下采样结构将语音数字数据进行下采样,同时另一个下采样结构将语音数字数据与噪音数字数据拼接后进行下采样;将两个下采样得到的特征数据进行拼接,得到的特征数据经过两次卷积后再上采样,每次上采样结果再与语音数字数据下采样的特征进行拼接,最后经过上采样结构的多次上采样得到生成语音数据。
7.根据权利要求6所述的抗噪声的移动巡检语音语义识别系统,其特征在于:语义识别模块实现对所述的生成语音数据进行语义识别,具体步骤包括:
步骤1、对所述的生成语音数据进行预处理,从所述的生成语音数据波形中提取出随时间变化的语音特征序列;
步骤2、将所述的语音特征序列传入搭建好的搜索空间中,通过维特比搜索寻找到最佳词串。
8.根据权利要求7所述的抗噪声的移动巡检语音语义识别系统,其特征在于:预处理过程是对所述的生成语音数据进行语音信号的端点检测、语音分帧和预加重处理。
9.根据权利要求7所述的抗噪声的移动巡检语音语义识别系统,其特征在于:所述搜索空间包括声学模型、语言模型或语音词典。
10.根据权利要求9所述的抗噪声的移动巡检语音语义识别系统,其特征在于:语音词典是建立的与电力行业有关术语的关键词数据库,包括:电力设备名称、电力操作常用词语、电力基本术语和电力常用单位名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司南京供电分公司,未经国网江苏省电力有限公司南京供电分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111315295.8/1.html,转载请声明来源钻瓜专利网。