[发明专利]一种回放语音的声纹识别方法、装置及存储介质在审
申请号: | 201811286647.X | 申请日: | 2018-10-31 |
公开(公告)号: | CN109300479A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 蔡晓东;王先傲 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L25/24;G10L25/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;蒋杰 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种回放语音的声纹识别方法、装置及存储介质,其方法包括:对待识别语音提取CQCC常Q倒谱系数;对待识别语音提取HFCC高频倒谱系数;将CQCC常Q倒谱系数和HFCC高频倒谱系数合并,得到Tandem特征;构建DNN深层神经网络,通过DNN深层神经网络对所述Tandem特征进行特征提取,得到embedding声纹特征;构建SVM分类器,将embedding声纹特征输入SVM分类器中,得到分类结果,根据分类结果确定所述待识别语音为真实语音或回放语音。本发明通过提取待识别语音的CQCC常Q倒谱系数和HFCC高频倒谱系数并将两者合成Tandem特征,能够便于构建的DNN深层神经网络提取较优的声纹特征,对声纹特征进行分类,从而识别得到真实语音或回放语音。 | ||
搜索关键词: | 倒谱系数 回放语音 声纹特征 神经网络 构建 存储介质 分类结果 声纹识别 语音提取 真实语音 语音 特征提取 合成 合并 分类 | ||
【主权项】:
1.一种回放语音的声纹识别方法,其特征在于,包括如下步骤:对待识别语音提取CQCC常Q倒谱系数;对所述待识别语音提取HFCC高频倒谱系数;将所述CQCC常Q倒谱系数和HFCC高频倒谱系数合并,得到Tandem特征;构建DNN深层神经网络,通过所述DNN深层神经网络对所述Tandem特征进行特征提取,得到embedding声纹特征;构建SVM分类器,将所述embedding声纹特征输入所述SVM分类器中,得到分类结果,根据所述分类结果确定所述待识别语音为真实语音或回放语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811286647.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种听力障碍者的辅助对话装置
- 下一篇:立体声信号的编解码方法和编解码装置