[发明专利]一种语音处理方法、装置、系统及计算机可读存储介质在审

申请号：	201811124680.2	申请日：	2018-09-26
公开（公告）号：	CN109065075A	公开（公告）日：	2018-12-21
发明（设计）人：	郑棉洲	申请（专利权）人：	广州势必可赢网络科技有限公司
主分类号：	G10L25/84	分类号：	G10L25/84;G10L25/24;G10L25/30
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	510000 广东省广州市黄埔***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声学特征音频信号分帧计算机可读存储介质类别信息语音处理语音信号预处理分类准确率分类模型工作负担工作效率特征提取预先建立分类申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音处理方法、装置、设备及计算机可读存储介质，包括对待处理语音信号进行预处理，得到多个分帧音频信号；对每个分帧音频信号进行特征提取，得到与每个分帧音频信号一一对应的MFCC声学特征参数；采用预先建立的DNN分类模型对各个MFCC声学特征参数进行训练，得到与每个MFCC声学特征参数一一对应的类别信息，类别信息包括人声和非人声。本申请能够自动对待处理语音信号进行非人声分类，不仅减轻了工作人员的工作负担，还大大提高了工作效率和分类准确率。

技术领域

本发明实施例涉及语音处理技术领域，特别是涉及一种语音处理方法、装置、系统及计算机可读存储介质。

背景技术

语音鉴定通常应用与安防工作，是把作案人和嫌疑人的说话录音分别通过语图仪(声纹仪)转换成条带状或曲线形语图(即声纹)，根据语图所反映的音频、音强与时间等语音特性进行比较，就嫌疑人是否为作案时的言语人做出鉴别与判断。

为了确保语音鉴定的准确度，在进语音鉴定之前，需要对语音信号进行处理，将语音信号中的非人声识别出来，从而减少非人声对语音鉴定的影响。

现有技术中在对语音信号中的非人声进行分类识别时，通过采用人工标定的方式进行非人声识别，例如观察语音信号的频谱图或者通过听语音信号进行判断和识别，工作量较大，不仅容易出错，而且工作效率低。

鉴于此，如何提供一种解决上述技术问题的语音处理方法、装置、系统及计算机可读存储介质成为本领域技术人员需要解决的问题。

发明内容

本发明实施例的目的是提供一种语音处理方法、装置、系统及计算机可读存储介质，在使用过程中能够自动对待处理语音信号进行非人声分类，不仅减轻了工作人员的工作负担，还大大提高了工作效率和分类准确率。

为解决上述技术问题，本发明实施例提供了一种语音处理方法，包括：

对待处理语音信号进行预处理，得到多个分帧音频信号；

对每个所述分帧音频信号进行特征提取，得到与每个所述分帧音频信号一一对应的梅尔频率倒谱系数MFCC声学特征参数；