[发明专利]一种不良语音检测方法、装置、电子设备及存储介质有效
申请号: | 201911049156.8 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110853648B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/02;G10L15/08;G10L25/51 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 黄诗彬;郝传鑫 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 不良 语音 检测 方法 装置 电子设备 存储 介质 | ||
1.一种不良语音检测方法,其特征在于,所述方法包括:
获取预设时长的待检测语音,并提取所述待检测语音的语音特征;
根据所述待检测语音的语音特征和预先建立的神经网络模型,对所述待检测语音进行语音识别和基于注意力机制的不良发音识别,获得所述待检测语音的文字序号分布和发音分类结果;其中,所述神经网络模型包含预设的文字库,所述文字库中每一个文字均对应有唯一的文字序号;
根据所述文字序号分布和预设的不良关键词字典,检测所述待检测语音中是否存在不良关键词;其中,所述不良关键词字典存储有预先收集的若干个不良关键词样本;
若所述待检测语音中存在不良关键词,则判定所述待检测语音为不良语音;
若所述待检测语音中不在不良关键词,则根据所述发音分类结果判断所述待检测语音是否为不良语音;
其中,所述待检测语音的语音特征为所述待检测语音的频谱特征,所述神经网络模型包括主干网络、语音识别网络和基于注意力机制建立的不良发音分类网络;则所述根据所述语音特征和预先建立的神经网络模型,对所述待检测语音进行语音识别和基于注意力机制的不良发音识别,获得所述待检测语音的文字序号分布和发音分类结果,具体包括:
根据所述主干网络和所述待检测语音的频谱特征,提取出所述待检测语音的序列特征;
将所述序列特征输入所述语音识别网络,获得所述待检测语音的所述文字序号分布;
将所述序列特征输入所述不良发音分类网络,获得所述待检测语音的发音分类结果。
2.如权利要求1所述的不良语音检测方法,其特征在于,所述方法预先通过以下步骤训练获得所述神经网络模型:
获取若干条预设时长的训练语音,并获取每一所述训练语音对应的文字序号分布标记信息和不良语音分类结果标记信息;
提取每一所述训练语音的语音特征,并将每一所述训练语音的语音特征输入初始神经网络模型,获得每一所述训练语音对应的初始文字序号分布和初始发音分类结果;
根据每一所述训练语音对应的所述文字序号分布标记信息和所述初始文字序号分布,对所述语音识别网络的第一损失函数进行计算,获得第一损失结果;
根据每一所述训练语音对应的所述不良语音分类结果标记信息和所述初始发音分类结果,对所述不良发音分类网络的第二损失函数进行计算,获得第二损失结果;
根据若干条所述训练语音对应的所述第一损失结果和第二损失结果,对所述初始神经网络模型进行迭代更新,直至所述初始神经网络模型收敛,获得所述神经网络模型。
3.如权利要求2所述的不良语音检测方法,其特征在于,所述第一损失函数为CTC损失函数,所述第二损失函数为交叉熵损失函数。
4.如权利要求1所述的不良语音检测方法,其特征在于,所述获取预设时长的待检测语音具体包括:
获取原始语音,并对所述原始语音进行滤波处理,获得有声语音;
将所述有声语音按照预设时长进行划分,获得若干个语音序列;
对每一所述语音序列进行归一化处理,获得若干个预设时长的所述待检测语音。
5.如权利要求1所述的不良语音检测方法,其特征在于,所述提取所述待检测语音的语音特征具体包括:
根据预设的窗函数,获得所述待检测语音的加窗语音信号;
将所述加窗语音信号进行傅里叶变换处理,获得所述待检测语音的频谱;
将所述频谱输入预设的梅尔滤波器,获得所述待检测语音的梅尔频谱;
根据预设的对数函数对所述待检测语音的所述梅尔频谱进行取对数,并对取对数后的梅尔频谱进行标准化处理,获得所述待检测语音的语音特征。
6.如权利要求1所述的不良语音检测方法,其特征在于,所述不良发音分类网络包括注意力机制层和全连接层,则所述将所述序列特征输入所述不良发音分类网络,获得所述待检测语音的发音分类结果具体包括:
将所述序列特征输入所述不良发音分类网络的注意力机制层,获得所述待检测语音的特征向量;
将所述特征向量输入所述全连接层,获得所述待检测语音的发音分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司,未经广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911049156.8/1.html,转载请声明来源钻瓜专利网。