[发明专利]声纹识别系统、方法、装置及电子设备有效
申请号: | 201910060740.7 | 申请日: | 2019-01-21 |
公开(公告)号: | CN111462760B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 郑斯奇;索宏彬;雷赟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/06 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 系统 方法 装置 电子设备 | ||
本申请公开了声纹识别方法和装置,声纹识别系统、方法和装置,以及,音箱和服务器。其中,声纹识别方法包括:获取已标注说话者信息的第一声纹数据集和未标注说话者信息的第二声纹数据集,从所述第一声纹数据集中学习得到第一声纹识别模型,至少通过第一声纹识别模型和第二声纹数据集训练得到第二声纹识别模型,至少基于所述第二声纹识别模型识别声纹数据。采用这种处理方式,使得利用非监督训练方式自动对声纹数据进行说话者信息的标注,避免人工方式标注数据;因此,可以有效提升数据标注的效率及准确度,从而提升声纹识别的准确度,同时可以有效降低人工成本。
技术领域
本申请涉及声纹识别技术领域,具体涉及声纹识别方法和装置,声纹识别系统、方法和装置,以及,音箱和服务器。
背景技术
声纹识别,属于生物识别技术的一种,也称为说话人识别。声纹识别就是把声信号转换成电信号,再用计算机通过声纹识别模型根据说话者的声学特征识别出说话者的身份。
一种典型的声纹识别方法是,通过机器学习的方式从训练数据中学习得到声纹识别模型,再基于声纹识别模型识别声纹数据。其中,训练数据包括声纹数据和标注好的说话者信息。目前,对于声纹数据的标注方式主要为人工标注方式,即:利用人工逐条对训练数据集中的每条声纹数据的说话者进行标注。
然而,在实现本发明过程中,发明人发现现有方案至少存在如下问题:由于需要大量人力和时间对训练数据的说话者信息进行标注,从而导致数据标注效率低,且人工成本高。此外,数据标注的准确率与标注人的经验有关,因而数据标注的准确率也无法保证。
发明内容
本申请提供声纹识别方法,以解决现有技术存在的数据标注准确度及效率低、且人工成本高的问题。本申请另外提供声纹识别装置,声纹识别系统、方法和装置,以及,音箱和服务器。
本申请提供一种声纹识别方法,包括:
获取已标注说话者信息的第一声纹数据集和未标注说话者信息的第二声纹数据集;
从所述第一声纹数据集中学习得到第一声纹识别模型;
至少通过第一声纹识别模型和第二声纹数据集训练得到第二声纹识别模型;
至少基于所述第二声纹识别模型识别声纹数据。
可选的,所述至少通过第一声纹识别模型和第二声纹数据集训练得到第二声纹识别模型,包括:
通过所述第一声纹识别模型,识别所述第二声纹数据的说话者信息;
从所述第一声纹数据集和由所述第二声纹数据的说话者信息标注的第二声纹数据集中,学习得到第二声纹识别模型。
可选的,所述通过所述第一声纹识别模型,并识别所述第二声纹数据的说话者信息,包括:
将所述第二声纹数据集划分为多个第二声纹数据子集;
遍历所述多个第二声纹数据子集,针对各个所述第二声纹数据子集执行如下步骤:
通过所述第一声纹识别模型,识别所述第二声纹数据子集包括的第二声纹数据的说话者信息;
根据训练所述第一声纹识别模型依据的声纹数据集、及由所述第二声纹数据的说话者信息标注的第二声纹数据子集,更新所述第一声纹识别模型。
可选的,所述第一声纹数据和所述第二声纹数据包括唤醒词声纹数据;
所述方法还包括:
获取未标注说话者信息的第三声纹数据集;所述第三声纹数据集包括唤醒词以外内容的声纹数据;
所述至少通过第一声纹识别模型和第二声纹数据集训练得到第二声纹识别模型,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910060740.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种播放器的控制电路和播放器
- 下一篇:由用户设备执行的切换方法以及用户设备