[发明专利]语音片段的检测方法、装置、电子设备及可读存储介质在审
申请号: | 202310752476.X | 申请日: | 2023-06-25 |
公开(公告)号: | CN116631448A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 倪仲福;程国艮;李欣杰;钱万里 | 申请(专利权)人: | 中译语通科技股份有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/24;G10L25/18;G10L25/21;G10L25/30 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100049 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 片段 检测 方法 装置 电子设备 可读 存储 介质 | ||
本申请提供了语音片段的检测方法、装置、电子设备及可读存储介质,获取待检测语音片段,并按照预设时间间隔提取待检测语音片段每帧的听觉倒谱系数,确定待检测语音系数序列;将待检测语音系数序列输入至预先训练好的语音识别模型中,通过语音识别模型输出待检测语音片段中每一帧语音对应的语音识别结果。这样,通过训练可以确定待检测语音片段中的语音特征与时间相关性的语音识别模型,对待检测语音片段中的有效语音片段以及噪声片段进行准确地分析和识别,有助于提升对语音片段检测的准确率。
技术领域
本申请涉及语音处理技术领域,尤其是涉及语音片段的检测方法、装置、电子设备及可读存储介质。
背景技术
短波通信是波长在100米~10米之间,频率范围3兆赫~30兆赫的一种无线电通信技术,短波通信方式中语音信息传播主要方式有两种:天波、地波。因为短波波长较短,因此主要靠天波传播。天波传播就是依靠无线电波从电离层反射回地面来传播消息。
但是,天波传输很不稳定,因为在天波传播过程中,路径衰耗、时间延迟、大气噪声、多径效应、电离层衰落等因素,都会造成信号的弱化与畸变,同时,在短波通话信噪比比较低的环境下,噪声会频繁出现,干扰对有效语音的检测,将会出现将噪声误检为有效语音信号的情况,对于语音片段检测的准确率较低。
发明内容
有鉴于此,本申请的目的在于提供语音片段的检测方法、装置、电子设备及可读存储介质,通过训练可以确定待检测语音片段中的语音特征与时间相关性的语音识别模型,对待检测语音片段中的有效语音片段以及噪声片段进行准确地分析和识别,有助于提升对语音片段检测的准确率。
第一方面,本申请实施例提供了一种语音片段的检测方法,所述检测方法包括:
获取待检测语音片段,并按照预设时间间隔提取所述待检测语音片段每帧的听觉倒谱系数,确定待检测语音系数序列;
将所述待检测语音系数序列输入至预先训练好的语音识别模型中,以使所述语音识别模型基于所述待检测语音系数序列中语音特征与时间相关性,输出所述待检测语音片段中每一帧语音对应的语音识别结果;
其中,所述每一帧语音对应的语音识别结果为该帧语音为有效语音片段,或者该帧语音为噪声片段。
在一种可能的实施方式中,通过以下确定待检测语音系数序列:
对所述待检测语音片段按照预设耳蜗频率范围,滤除不在预设耳蜗频率范围内的语音后,得到滤波后的滤波语音片段;
针对于所述滤波语音片段按照预设时间间隔分帧处理,确定每帧输出信号;
针对于每帧输出信号,计算该帧输出信号的短时对数能量,并基于所述短时对数能量,确定该帧输出信号对应的听觉倒谱系数;
按照每帧对应的时间顺序,集合所述听觉倒谱系数,生成所述待检测语音系数序列。
在一种可能的实施方式中,所述语音识别模型包括深度神经网络层、长短时记忆单元层以及预测层;
所述将所述待检测语音系数序列输入至预先训练好的语音识别模型中,以使所述语音识别模型基于所述待检测语音系数序列中语音特征与时间相关性,输出所述待检测语音片段中每一帧语音对应的语音识别结果,包括:
将所述待检测语音系数序列输入至所述深度神经网络层,以使所述深度神经网络层按照所述待检测语音系数序列中每个听觉倒谱系数对应的时间顺序进行系数处理,确定每个时刻的第一处理结果;
控制所述深度神经网络层中每个时刻的第一处理结果参与所述长短时记忆单元层各个时刻的处理,得到每个时刻的第二处理结果;
将各个时刻的第二处理结果输入至所述预测层,确定每个时刻对应的语音检测概率,并基于所述各个时刻对应的语音检测概率,输出所述待检测语音片段中每一帧语音对应的语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310752476.X/2.html,转载请声明来源钻瓜专利网。