[发明专利]语音片段的检测方法、装置、电子设备及可读存储介质在审
申请号: | 202310752476.X | 申请日: | 2023-06-25 |
公开(公告)号: | CN116631448A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 倪仲福;程国艮;李欣杰;钱万里 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/24;G10L25/18;G10L25/21;G10L25/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100049 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 片段 检测 方法 装置 电子设备 可读 存储 介质 | ||
1.一种语音片段的检测方法,其特征在于,所述检测方法包括:
获取待检测语音片段,并按照预设时间间隔提取所述待检测语音片段每帧的听觉倒谱系数,确定待检测语音系数序列;
将所述待检测语音系数序列输入至预先训练好的语音识别模型中,以使所述语音识别模型基于所述待检测语音系数序列中语音特征与时间相关性,输出所述待检测语音片段中每一帧语音对应的语音识别结果;
其中,所述每一帧语音对应的语音识别结果为该帧语音为有效语音片段,或者该帧语音为噪声片段。
2.根据权利要求1所述的检测方法,其特征在于,通过以下确定待检测语音系数序列:
对所述待检测语音片段按照预设耳蜗频率范围,滤除不在预设耳蜗频率范围内的语音后,得到滤波后的滤波语音片段;
针对于所述滤波语音片段按照预设时间间隔分帧处理,确定每帧输出信号;
针对于每帧输出信号,计算该帧输出信号的短时对数能量,并基于所述短时对数能量,确定该帧输出信号对应的听觉倒谱系数;
按照每帧对应的时间顺序,集合所述听觉倒谱系数,生成所述待检测语音系数序列。
3.根据权利要求1所述的检测方法,其特征在于,所述语音识别模型包括深度神经网络层、长短时记忆单元层以及预测层;
所述将所述待检测语音系数序列输入至预先训练好的语音识别模型中,以使所述语音识别模型基于所述待检测语音系数序列中语音特征与时间相关性,输出所述待检测语音片段中每一帧语音对应的语音识别结果,包括:
将所述待检测语音系数序列输入至所述深度神经网络层,以使所述深度神经网络层按照所述待检测语音系数序列中每个听觉倒谱系数对应的时间顺序进行系数处理,确定每个时刻的第一处理结果;
控制所述深度神经网络层中每个时刻的第一处理结果参与所述长短时记忆单元层各个时刻的处理,得到每个时刻的第二处理结果;
将各个时刻的第二处理结果输入至所述预测层,确定每个时刻对应的语音检测概率,并基于所述各个时刻对应的语音检测概率,输出所述待检测语音片段中每一帧语音对应的语音识别结果。
4.根据权利要求1所述的检测方法,其特征在于,通过以下步骤训练所述语音识别模型:
获取多条样本语音,并对每条样本语音分帧处理后,对每帧语音样本的声学特征以及语音识别特征进行标注,得到多条标注语音;
分帧提取每条标注语音的样本语音特征向量,将所述样本语音特征向量输入至预先构建的深度学习-长短记忆模型中,输出每条标注语音中每帧语音对应的语音识别结果;
确定每条标注语音中每帧语音对应的语音识别结果与每帧语音样本的标注不同的语音帧数量;
若语音识别结果与每帧语音样本的标注不同的语音帧数量大于预设帧数量阈值,调整所述深度学习-长短记忆模型中的参数,直至语音识别结果与每帧语音样本的标注不同的语音帧数量小于预设帧数量阈值,确定所述深度学习-长短记忆模型训练结束,得到所述语音识别模型。
5.根据权利要求4所述的检测方法,其特征在于,通过以下步骤获取样本语音:
获取多条包含说话人语音的初始语音数据以及不包含说话人语音的初始噪声数据;
对每条初始语音数据以及每条初始噪声数据的采样频率进行统一,得到统一采样频率后的目标语音数据以及目标噪声数据;
将目标噪声数据随机插入所述目标语音数据中的不同位置,将所述目标语音数据以及所述目标噪声数据融合,得到所述样本语音。
6.根据权利要求1所述的检测方法,其特征在于,在所述输出所述待检测语音片段中每一帧语音对应的语音识别结果之后,所述检测方法还包括:
确定预设检测时间段内对于语音片段检测的识别评价指标,并计算所述识别评价指标的目标导数值以及预设网络层数范围中所述识别评价指标的目标离散程度;
基于所述目标导数值以及所述目标离散程度,调整所述语音识别模型中的网络层数,优化语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310752476.X/1.html,转载请声明来源钻瓜专利网。