[发明专利]端到端的声纹识别方法和声纹识别装置在审
申请号: | 202111164838.0 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113870860A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 王凯;张晓雷;张淼 | 申请(专利权)人: | 三星(中国)半导体有限公司;三星电子株式会社 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L25/24;G10L25/30 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 方成;张川绪 |
地址: | 710000 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端到端 声纹 识别 方法 装置 | ||
公开了一种端到端的声纹识别方法和声纹识别装置。所述声纹识别方法包括:基于接收的输入语音,使用端到端深度学习网络的说话人语音提取模块执行说话人语音提取任务,以提取目标说话人的语音特征;基于目标说话人的语音特征,使用端到端深度学习网络的说话人识别模块执行说话人识别任务,以在接收的输入语音中识别目标说话人。
技术领域
本发明涉及语音技术领域,更具体地,涉及一种声纹识别方法和声纹识别装置。
背景技术
随着各种电子设备的普及,对电子设备的安全保护变得尤为重要。尤其是,期望电子设备仅在被注册的用户使用时才会被认证和/或解锁,从而防止电子设备被其他不被允许的人使用。
为了实现电子设备的安全保护,声音可作为用户的独特的信息而被使用。更具体地讲,声纹识别(Voiceprint Identification)技术(又称,说话人识别(SpeakerVerification)技术)可被使用。通过声纹识别技术,可从说话人的语音中提取语音特征,并对语音特征进行身份验证。通常声纹识别分为注册和验证两个过程。在注册过程中,用户存储自身声纹信息作为注册用户;在验证过程中,将从说话人的语音中提取到的声纹特征与预先注册的声纹特征进行对比,得到特征的相似度得分,将该得分与阈值进行对比,若此得分大于阈值,判断为验证与注册为同一用户,若此得分小于或等于阈值,判断为验证与注册为不同用户。
然而,在实际应用场景中,用户的声音环境比较复杂。现有的声纹识别技术往往只能应对相对单一的应用的场景,而无法有效地满足用户的需要。
发明内容
本发明的目的在于提供一种端到端的声纹识别方法和声纹识别装置。
在本公开的一方面,提供一种端到端的声纹识别方法,所述声纹识别方法包括:基于接收的输入语音,使用端到端深度学习网络的说话人语音提取模块执行说话人语音提取任务,以提取目标说话人的语音特征;基于目标说话人的语音特征,使用端到端深度学习网络的说话人识别模块执行说话人识别任务,以在接收的输入语音中识别目标说话人。
所述声纹识别方法还可包括:基于接收的输入语音,提取输入语音的原始语音特征;其中,执行说话人语音提取任务的步骤包括:基于原始语音特征和预先保存的注册人中间嵌入语音特征,执行说话人语音提取任务。
所述声纹识别方法还可包括:基于目标说话人的语音特征和原始语音特征,确定输入语音的说话场景,说话场景包括单人场景和多人场景,其中,执行说话人识别任务的步骤包括:基于输入语音的说话场景来执行说话人识别任务。
确定输入语音的说话场景是单人场景还是多人场景的步骤可包括:当目标说话人的语音特征与原始语音特征之间的均方误差小于阈值时,将输入语音的说话场景确定为单说话人场景;当目标说话人的语音特征与原始语音特征之间的均方误差大于或等于阈值时,将输入语音的说话场景确定为多说话人场景,其中,执行说话人识别任务的步骤包括:当输入语音的说话场景为单说话人场景时,将原始语音特征输入到说话人识别模块,利用预先保存的注册人最终语音特征在接收的输入语音中识别目标说话人;当输入语音的说话场景为多说话人场景时,将目标说话人的语音特征输入到说话人识别模块,利用注册人最终语音特征在接收的输入语音中识别目标说话人。
在注册人的声纹注册阶段,所述声纹识别方法还可包括:基于接收的注册人语音,提取注册人语音的原始语音特征;基于注册人语音的原始语音特征,利用说话人识别模块提取注册人中间嵌入语音特征并保存;基于注册人中间嵌入语音特征,利用说话人识别模块提取注册人最终语音特征并保存。
执行说话人语音提取任务的步骤可包括:利用第一卷积层,从原始语音特征提取目标说话人中间嵌入语音特征;利用拼接层,将目标说话人中间嵌入语音特征和注册人中间嵌入语音特征拼接为拼接特征;利用全卷积层将输入的拼接特征生成掩膜;利用乘法器将掩膜与目标说话人中间嵌入语音特征相乘得到目标说话人的语音特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星(中国)半导体有限公司;三星电子株式会社,未经三星(中国)半导体有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111164838.0/2.html,转载请声明来源钻瓜专利网。