[发明专利]一种语音检测方法及装置有效

申请号：	201910594785.2	申请日：	2019-07-03
公开（公告）号：	CN110349597B	公开（公告）日：	2021-06-25
发明（设计）人：	冷严;林蝉;赵玮玮;齐广慧;李登旺	申请（专利权）人：	山东师范大学
主分类号：	G10L25/60	分类号：	G10L25/60;G10L25/24;G10L15/08;G10L15/06
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	张庆骞
地址：	250014 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本公开提供了语音检测方法及装置。语音检测方法包括构建语音检测模型；其由第一GMM模型、第二GMM模型和LSTM模型并联连接之后再与RNN模型串联构成；训练语音检测模型的过程为：利用语音数据、非语音数据及语音和非语音混合数据分别对应训练第一GMM模型、第二GMM模型和LSTM模型，输出相应识别得分值，组成一个三维向量，作为音频片段的向量表征；将每个时刻、每个时刻前一时刻及后一时刻的音频片段向量表征组成一个时间序列，作为输入量来训练RNN模型；测试音频数据的过程为：分割测试音频数据为若干个音频片段，再逐个输入至训练完成的语音检测模型，得到相应时刻的音频片段属于语音的概率值，通过对比概率值和设定阈值将音频片段判别为语音或非语音。
搜索关键词：	一种语音检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音检测方法，其特征在于，包括：构建语音检测模型；所述语音检测模型由第一GMM模型、第二GMM模型和LSTM模型并联连接之后再与RNN模型串联构成；训练语音检测模型；其过程为：利用语音数据、非语音数据及语音和非语音混合数据分别对应训练第一GMM模型、第二GMM模型和LSTM模型，输出相应识别得分值，进而组成一个三维向量，作为音频片段的向量表征；将每个时刻、每个时刻前一时刻及后一时刻的音频片段向量表征组成一个时间序列，作为输入量来训练RNN模型，直至输出的所有时刻的音频片段属于语音的平均概率值偏差符合预设精度要求；测试音频数据；其过程为：分割测试音频数据为若干个音频片段，再将音频片段逐个输入至训练完成的语音检测模型，得到相应时刻的音频片段属于语音的概率值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东师范大学，未经山东师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910594785.2/，转载请声明来源钻瓜专利网。

上一篇：一种基于深度学习的钢琴考级评定方法及装置
下一篇：一种低信噪比环境下的端点检测方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音检测方法及装置有效

专利文献下载