[发明专利]声纹识别方法、装置、计算机设备及存储介质在审
申请号: | 201810573715.4 | 申请日: | 2018-06-06 |
公开(公告)号: | CN108899032A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 涂宏 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 胡志桐 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹识别 语音 语音特征 截顶 标准语音特征 计算机设备 存储介质 目标语音 修复 获取目标 算法检测 语音检测 语音识别 原始语音 语音段 预设 携带 | ||
1.一种声纹识别方法,其特征在于,包括:
获取待识别语音,所述待识别语音携带说话人标识;
基于所述待识别语音,获取对应的待识别语音特征;
采用截顶语音检测算法检测所述待识别语音,若所述待识别语音为截顶语音段,则采用截顶语音修复模型修复所述待识别语音特征,获取目标语音特征;
基于所述说话人标识对应的标准语音特征,采用预设声纹识别模型对所述目标语音特征和所述标准语音特征进行声纹识别,获取所述目标语音特征和所述标准语音特征是否对应同一说话人的声纹识别结果。
2.如权利要求1所述声纹识别方法,其特征在于,所述基于所述待识别语音,获取对应的待识别语音特征,包括:
对所述待识别语音进行预处理,获取预处理语音数据;
对所述预处理语音数据作快速傅里叶变换,获取所述待识别语音的频谱,并根据所述频谱获取所述待识别语音的功率谱;
采用梅尔刻度滤波器组处理所述待识别语音的功率谱,获取所述待识别语音的梅尔功率谱;
在所述梅尔功率谱上进行倒谱分析,获取所述待识别语音的梅尔频率倒谱系数。
3.如权利要求1所述声纹识别方法,其特征在于,所述采用截顶语音检测算法检测所述待识别语音,若所述待识别语音为截顶语音段,包括:
将所述待识别语音按时序平均分割出至少两个语音子段;
将所述语音子段按音量变化均匀分割成至少两个音量子区间,获取最高音所在的音量子区间的高音采样点数量;
统计所有所述音量子区间的采样点总数,以获取所述高音采样点数量相对所述采样点总数的高音采样百分比;
若所述高音采样百分比超过预设阈值,则对应的所述语音子段为截顶语音段。
4.如权利要求1所述声纹识别方法,其特征在于,在所述采用截顶语音修复模型修复所述待识别语音特征的步骤之前,所述声纹识别方法还包括:
获取原始训练语音对应的原始训练特征,对该原始训练语音进行截顶语音处理以获取对应的截顶训练语音,再提取该截顶训练语音的截顶训练特征;
将所述截顶训练语音对应的截顶训练特征作为DNN模型的输入层,将所述原始训练语音对应的原始训练特征作为DNN模型的输出层,校准所述DNN模型的特征参数,以生成基于DNN模型的截顶语音修复模型。
5.如权利要求4所述声纹识别方法,其特征在于,所述采用截顶语音修复模型修复所述待识别语音特征,获取目标语音特征,包括:
采用所述基于DNN模型的截顶语音修复模型修复所述待识别语音特征,获取目标语音特征。
6.如权利要求1所述声纹识别方法,其特征在于,所述基于所述说话人标识对应的标准语音特征,采用预设声纹识别模型对所述目标语音特征和所述标准语音特征进行声纹识别,包括:
采用预设声纹识别模型分别处理所述目标语音特征和所述标准语音特征,分别得到原始语音向量和标准语音向量;
获取所述原始语音向量和所述标准语音向量的空间距离;
根据所述空间距离与预设的距离阈值,获取所述目标语音特征和所述标准语音特征是否对应同一说话人的声纹识别结果。
7.如权利要求6所述声纹识别方法,其特征在于,所述获取所述原始语音向量和所述标准语音向量的空间距离,包括:
采用余弦相似度算法获取所述原始语音向量和所述标准语音向量的空间距离。
8.一种声纹识别装置,其特征在于,包括:
获取待识别语音模块,用于获取待识别语音,所述待识别语音携带说话人标识;
获取待识别特征模块,用于基于所述待识别语音,获取对应的待识别语音特征;
获取目标语音特征模块,用于采用截顶语音检测算法检测所述待识别语音,若所述待识别语音为截顶语音段,则采用截顶语音修复模型修复所述待识别语音特征,获取目标语音特征;
获取声纹识别结果模块,用于基于所述说话人标识对应的标准语音特征,采用预设声纹识别模型对所述目标语音特征和所述标准语音特征进行声纹识别,获取所述目标语音特征和所述标准语音特征是否对应同一说话人的声纹识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810573715.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及装置
- 下一篇:一种确定说话人特征的方法及装置