[发明专利]语音验证方法、语音验证模型的训练方法及相关装置在审
申请号: | 202210444072.X | 申请日: | 2022-04-25 |
公开(公告)号: | CN115064174A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 陈庭威;黄景标;方瑞东;林聚财;刘克柱;毛亚朋;黄威震;殷俊 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/06;G10L25/78 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 验证 方法 模型 训练 相关 装置 | ||
本申请公开了一种语音验证方法、语音验证模型的训练方法及相关装置,其中,语音验证方法包括:对测试语音进行第一特征提取,得到测试语音的音频特征,并对目标对象发出的参考语音进行第一特征提取,得到参考语音的音频特征;其中,不同对象所发出语音的音频特征不同;以及对测试语音进行第二特征提取,得到测试语音的鉴别特征;其中,鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息;再基于测试语音的音频特征、参考语音的音频特征和鉴别特征,得到测试语音的验证结果;其中,验证结果包括测试语音是否由目标对象说出。上述方案,能够提高语音验证的准确率。
技术领域
本申请涉及音频处理技术领域,特别是涉及一种语音验证方法、语音验证模型的训练方法及相关装置。
背景技术
在诸多场景中,语音验证的准确性都格外重要。例如,在门禁控制场景中,通过分析语音验证的结果,有助于提升门禁控制中的安全性;或者,在语音通话过程中需要对电话授权时,通过语音验证可以提升电话授权的可靠性,如此种种,不一而足。
目前,语音验证一般采用对说话人验证(Automatic speaker verification,ASV),或者先进行说话人验证,再进行攻击验证(CounterMeasure,CM),即串联两种验证方式得到语音验证结果。然而,前者对合成语音等虚假语音缺乏防范之力,后者对对未知类型攻击的泛化能力较差,进而导致误判率较高。有鉴于此,如何提高语音验证的准确率成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种语音验证方法、语音验证模型的训练方法及相关装置,能够提高语音验证的准确率。
为了解决上述技术问题,本申请第一方面提供了一种语音验证方法,包括:对测试语音进行第一特征提取,得到测试语音的音频特征,并对目标对象发出的参考语音进行第一特征提取,得到参考语音的音频特征;其中,不同对象所发出语音的音频特征不同;以及对测试语音进行第二特征提取,得到测试语音的鉴别特征;且鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息;再基于测试语音的音频特征、参考语音的音频特征和鉴别特征,得到测试语音的验证结果;且验证结果包括测试语音是否由目标说话人说出。
为了解决上述技术问题,本申请第二方面提供了一种语音验证模型的训练方法,语音验证模型包括对象识别网络和语音鉴别网络,语音验证模型的训练方法包括:获取样本测试语音、样本目标对象的样本参考语音和样本测试语音的样本验证结果;且样本验证结果包括样本测试语音实际是否由样本目标对象说出;基于对象识别网络对样本测试语音进行第一特征提取,得到样本测试语音的样本音频特征,并基于对象识别网络对样本参考语音进行第一特征提取,得到样本参考语音的样本音频特征;且不同样本对象所发出样本语音的样本音频特征不同;以及基于语音鉴别网络对样本测试语音进行第二特征提取,得到样本鉴别特征;且样本鉴别特征包含用于鉴别发出样本测试语音的样本对象是否为活体的特征信息;基于样本测试语音的样本音频特征、样本参考语音的样本音频特征和样本鉴别特征,得到样本测试语音的预测验证结果;且预测验证结果包括样本测试语音经预测是否由样本目标对象说出;基于样本验证结果与预测验证结果之间的差异,调整语音验证模型的网络参数。
为了解决上述技术问题,本申请第三方面提供了一种语音验证装置,包括第一提取模块、第二提取模块和结果预测模块,第一提取模块用于对测试语音进行第一特征提取,得到测试语音的音频特征,并对目标对象发出的参考语音进行第一特征提取,得到参考语音的音频特征;且不同对象所发出语音的音频特征不同;第二提取模块用于对测试语音进行第二特征提取,得到测试语音的鉴别特征;且鉴别特征包含用于鉴别发出测试语音的对象是否为活体的特征信息;结果预测模块用于基于测试语音的音频特征、参考语音的音频特征和鉴别特征,得到测试语音的验证结果;且验证结果包括测试语音是否由目标说话人说出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210444072.X/2.html,转载请声明来源钻瓜专利网。