[发明专利]一种语音检测方法及装置有效
申请号: | 201910594785.2 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110349597B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 冷严;林蝉;赵玮玮;齐广慧;李登旺 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/24;G10L15/08;G10L15/06 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了语音检测方法及装置。语音检测方法包括构建语音检测模型;其由第一GMM模型、第二GMM模型和LSTM模型并联连接之后再与RNN模型串联构成;训练语音检测模型的过程为:利用语音数据、非语音数据及语音和非语音混合数据分别对应训练第一GMM模型、第二GMM模型和LSTM模型,输出相应识别得分值,组成一个三维向量,作为音频片段的向量表征;将每个时刻、每个时刻前一时刻及后一时刻的音频片段向量表征组成一个时间序列,作为输入量来训练RNN模型;测试音频数据的过程为:分割测试音频数据为若干个音频片段,再逐个输入至训练完成的语音检测模型,得到相应时刻的音频片段属于语音的概率值,通过对比概率值和设定阈值将音频片段判别为语音或非语音。 | ||
搜索关键词: | 一种 语音 检测 方法 装置 | ||
【主权项】:
1.一种语音检测方法,其特征在于,包括:构建语音检测模型;所述语音检测模型由第一GMM模型、第二GMM模型和LSTM模型并联连接之后再与RNN模型串联构成;训练语音检测模型;其过程为:利用语音数据、非语音数据及语音和非语音混合数据分别对应训练第一GMM模型、第二GMM模型和LSTM模型,输出相应识别得分值,进而组成一个三维向量,作为音频片段的向量表征;将每个时刻、每个时刻前一时刻及后一时刻的音频片段向量表征组成一个时间序列,作为输入量来训练RNN模型,直至输出的所有时刻的音频片段属于语音的平均概率值偏差符合预设精度要求;测试音频数据;其过程为:分割测试音频数据为若干个音频片段,再将音频片段逐个输入至训练完成的语音检测模型,得到相应时刻的音频片段属于语音的概率值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910594785.2/,转载请声明来源钻瓜专利网。