[发明专利]一种基于增强型声纹库的语音身份确定方法及系统在审
申请号: | 202110497736.4 | 申请日: | 2021-05-08 |
公开(公告)号: | CN112992154A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 白世杰;吴富章;赵宇航;王秋明 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/06;G10L17/22 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增强 声纹 语音 身份 确定 方法 系统 | ||
本申请提供了一种基于增强型声纹库的语音身份确定方法及系统。获取待查询语音;分别将待查询语音的第一声纹特征向量、第一关键字特征向量以及第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定待鉴定用户与每个候选用户之间的语音相似度;将语音相似度位于前预设位的候选用户,确定为目标用户;并将目标用户的原始语音发送给鉴定人员,以供所述鉴定人员基于原始语音确定待鉴定用户的身份信息。这样,本申请在对待查询语音进行身份确定时,充分使用了语音数据中的声纹特征、关键字特征以及主题特征进行语音特征比对,从而可以提高查询比对的命中率以及识别效率。
技术领域
本申请涉及声纹识别技术领域,尤其是涉及一种基于增强型声纹库的语音身份确定方法及系统。
背景技术
目前声纹库的建立方法为采集一段语音,根据采集的语音进行声纹特征提取,将提取的声纹特征存入数据库中形成声纹库。使用这种声纹库对待查询语音所属的目标人物进行确认时,采用的技术手段为:将待查询的声纹特征与声纹库中的声纹特征一一比对,计算声纹特征之间的相似性,根据相似性的大小进行排序,将相似性最大的作为查询比对结果。但由于声纹特征不明显,这种使用传统的声纹库识别语音的方法导致识别率较低以及比对结果准确度较低,因此,如何提高语音识别率一直是公安单位亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种基于增强型声纹库的语音身份确定方法及系统,在对待查询语音进行身份确定时,充分使用了语音数据中的声纹特征、关键字特征以及主题特征进行语音特征比对,从而可以提高查询比对的命中率以及识别效率。
本申请实施例提供了一种基于增强型声纹库的语音身份确定方法,所述语音身份确定方法,包括:
获取待查询语音;
从所述待查询语音中提取待鉴定用户的第一声纹特征向量、第一关键字特征向量以及第一主题特征向量;
分别将所述第一声纹特征向量、所述第一关键字特征向量以及所述第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定所述待鉴定用户与每个候选用户之间的语音相似度;
将语音相似度位于前预设位的候选用户,确定为目标用户;
按照所述目标用户的唯一身份标识对应的原始语音存储地址,获取所述目标用户的原始语音,并将所述原始语音发送给鉴定人员,以供所述鉴定人员基于所述原始语音确定所述待鉴定用户的身份信息。
进一步的,通过以下步骤构建增强型声纹库:
获取多个候选用户的至少一条原始语音;
针对于每个候选用户,从该候选用户的至少一条原始语音中提取出该候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量;
通过该候选用户的唯一身份标识绑定该候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量以及该候选用户的原始语音存储地址;
基于每个候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量、原始语音存储地址以及唯一身份标识,构建增强型声纹库。
进一步的,通过以下步骤提取每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量:
针对于每个候选用户,利用预先训练好的声纹特征提取模型,对该候选用户的至少一条原始语音进行声纹特征提取,确定出至少一个候选声纹特征向量,对确定出的至少一个候选声纹特征向量进行均值处理,将进行均值处理后得到的特征向量作为该候选用户的第二声纹特征向量;
利用预先训练好的语音内容识别模型,对该候选用户的至少一条原始语音进行文本识别提取,得到至少一个文本内容,利用预先建立好的关键字词库对至少一个文本内容进行关键字提取,确定出至少一个候选关键字特征向量,并求取确定出的至少一个候选关键字特征向量的并集,将求取完并集得到的特征向量作为该候选用户的第二关键字特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110497736.4/2.html,转载请声明来源钻瓜专利网。