[发明专利]基于语音降噪的声纹识别的方法及系统以及智能终端在审
申请号: | 201610025060.8 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971733A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L21/0208 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 声纹 识别 方法 系统 以及 智能 终端 | ||
1.一种基于语音降噪的声纹识别的方法,适用于智能终端,其特征在于,包括:
步骤S1,采集外部输入的语音,并判断所述语音的声音强度是否高于一预设的强度阈值,并在所述声音强度高于所述强度阈值时将所述语音确认为待判断语音,并转向步骤S2;
步骤S2,根据所述待判断语音的频谱,生成对应所述待判断语音上每个频带的估计标识,所述估计标识用于表示所述语音在谐波结构上的显著性;
步骤S3,生成对应于所述待判断语音的纯语音的概率模型;
步骤S4,以每个所述估计标识作为对应的所述待判断语音的所述频带的权重指标,依据所述概率模型处理得到关联于所述语音的纯语音估计值;
步骤S5,判断所述纯语音估计值是否大于一预设的估计阈值,若是执行步骤S6,若否,返回执行所述步骤S1;
步骤S6,根据所述纯语音估计值获取语音流,依据预设的声纹识别模型对所述语音流进行声纹识别。
2.如权利要求1所述的基于语音降噪的声纹识别的方法,其特征在于,所述步骤S2中生成的所述估计标识包括第一估计标识;或者
所述步骤S2中生成的所述估计标识包括第一估计标识和第二估计标识。
3.如权利要求2所述的基于语音降噪的声纹识别的方法,其特征在于,所述步骤S2中,生成所述第一估计标识的步骤具体包括:
步骤S21a,依据所述待判断语音的所述频谱,提取对应于所述待判断语音的所述谐波结构;
步骤S22a,对关联于所述谐波结构的数谱域上的监控值进行规则化处理,并依据梅尔刻度对经过规则化处理的所述监控值执行平滑处理;
步骤S23a,对经过平滑处理的所述监控值进行进一步的规则化处理,以使所述监控值的均值为1;
步骤S24a,根据所述监控值生成对应所述待判断语音的每个所述频带的所述第一估计标识。
4.如权利要求3所述的基于语音降噪的声纹识别的方法,其特征在于, 所述步骤S4中,根据所述第一估计标识处理得到所述纯语音估计值的方法具体包括:
步骤S41a,处理得到关联于所述待判断语音的最小均方误差估计的后验概率;
步骤S42a,以每个所述第一估计标识作为对应的所述待判断语音的所述频带的权重指标,依据所述概率模型对关联于所述待判断语音的所述后验概率进行加权计算,以得到所述纯语音估计值。
5.如权利要求3所述的基于语音降噪的声纹识别的方法,其特征在于,所述步骤S2中,生成所述第二估计标识的步骤具体包括:
步骤S21b,依据所述待判断语音的所述频谱,提取对应于所述待判断语音的所述谐波结构;
步骤S22b,对关联于所述谐波结构的数谱域上的监控值进行规则化处理,并依据梅尔刻度对经过规则化处理的所述监控值执行平滑处理;
步骤S23b,对经过平滑处理的所述监控值从0到1进行相应的规则化处理;
步骤S24b,根据所述监控值生成对应所述待判断语音的每个所述频带的所述第二估计标识。
6.如权利要求5所述的基于语音降噪的声纹识别的方法,其特征在于,执行所述步骤S4之后,还根据所述第二估计标识继续执行下述步骤:
针对所述待判断语音的每个频带,将每个对应的所述第二估计标识作为权重,以在所述监控值与所述纯语音估计值之间执行线性插值并处理得到对应的输出值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610025060.8/1.html,转载请声明来源钻瓜专利网。