[发明专利]一种提升声纹识别准确度的方法和系统在审
申请号: | 201610024149.2 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971736A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L17/04;G06F21/32 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提升 声纹 识别 准确度 方法 系统 | ||
技术领域
本发明涉及声纹识别技术领域,具体而言,涉及一种提升声纹识别准确度的方法和系统。
背景技术
声纹识别,属于生物识别技术的一种,声纹技术因为其采集设备的硬件(普通麦克风即可)成本较低,并且伪造难度高的特点,从而被较多的智能设备所运用,目前声纹识别包括两类分别是,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题,而在声纹的识别过程中,往往受到使用者身体状态或者麦克风的信道外部因素的干扰下影响识别的准确度,给使用者带来不便。
发明内容
根据现有技术中存在的上述问题,现提供一种提升声纹识别准确度的方法及系统的技术方案,具体包括:
一种提升声纹识别准确度的方法,其中,包括:
获取同一使用者在不同状态下的声纹,以构建多个与所述声纹相对应的背景识别模型,其中,所述背景声纹特征中包括多个背景声纹特征向量;
根据所述背景识别模型构建所述标准识别模型;
对所述标准识别模型划分识别优先级;
获取未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;
将所述未识别声纹特征与声纹识别模型中的标准声纹特征按照优先级进行处理得到对应于所述未识别声纹的辨别度,
判断所述辨别度是否大于一预设的标准阈值,当所述辨别度大于所述标准 阈值时,则识别出所述未识别声纹为锁定声纹;
所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:
检测所述未识别声纹中的浊音区间;
在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。
优选的,该提升声纹识别准确度的方法,其中,在所述提取未识别声纹中的未识别声纹特征之前,还包括:
采集所述未识别声纹;
至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,以构造出与所述未识别声纹相适应的所述声纹识别模型中的所述标准声纹特征中的标准声纹特征向量。
优选的,该提升声纹识别准确度的方法,其中,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,其中,所述至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准声纹特征向量的向量距离;
根据处理得到的多个所述向量距离处理得到所述未识别声纹特征与所述标准声纹特征的目标距离;
至少利用所述未识别声纹特征与所述标准声纹特征的所述目标距离处理得到所述未识别声纹的辨别度。
优选的,该提升声纹识别准确度的方法,其中,所述至少利用所述未识别声纹特征与所述标准声纹特征的距离处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征分别与多个所述背景识别模型对应的每个所述声纹的所述背景声纹特征的背景距离;
根据多个所述背景距离处理得到距离平均值及距离标准差;
处理得到所述未识别声纹特征与所述标准声纹特征的所述目标距离与所述距离平均值的差值;
处理得到所述差值与所述距离标准差的比值,将所述比值作为所述未识别声纹的所述辨别度。
优选的,该提升声纹识别准确度的方法,其中,所述在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素包括:
在每个所述基音区间中获取预定的特征向量,并根据小波滤波器将多个所述基音区间中的所述特征向量划分为预定长度的样本向量,并将所述预定长度的样本向量归一化;
对归一化后的所述预定长度的样本向量执行以下至少一种小波变换:
对归一化后的所述预定长度的样本向量进行实小波变换,以得到第一预定频带的实部系数,并在所述第一预定频带中选择满足第一预定条件的频带进行采样,以得到所述未识别声纹特征中的所述实小波元素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024149.2/2.html,转载请声明来源钻瓜专利网。