[发明专利]一种伪造语音的识别方法、装置、电子设备及存储介质有效
申请号: | 202110759437.3 | 申请日: | 2021-07-06 |
公开(公告)号: | CN113257255B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 郑榕;孟凡芹 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 伪造 语音 识别 方法 装置 电子设备 存储 介质 | ||
1.一种伪造语音的识别方法,其特征在于,所述识别方法包括:
获取多个待鉴别语音,以及每个待鉴别语音的第一鉴别声纹特征和第一伪造语音特征;
针对于每个待鉴别语音,基于该待鉴别语音的第一鉴别声纹特征,确定该待鉴别语音与每个候选声纹特征之间的第一声纹相似度;
利用所述第一声纹相似度大于预设第一分数阈值的待鉴别语音构造第一鉴别语音集合,并确定所述第一鉴别语音集合中每个待鉴别语音对应的目标声纹特征;
基于所述第一鉴别语音集合中每个待鉴别语音的第一伪造语音特征,确定所述第一鉴别语音集合中每个待鉴别语音的第一伪造分数,并利用所述第一伪造分数大于预设第二分数阈值的待鉴别语音构造第二鉴别语音集合;
针对于所述第二鉴别语音集合中的每个待鉴别语音,提取该待鉴别语音的第二鉴别声纹特征和第二伪造语音特征;
基于每个待鉴别语音的第二鉴别声纹特征,确定每个待鉴别语音与每个目标声纹特征的第二声纹相似度,并基于所述第一声纹相似度和所述第二声纹相似度,确定出用于构造第三鉴别语音集合的待鉴别语音,并构造所述第三鉴别语音集合;
基于每个待鉴别语音的第二伪造语音特征,确定每个待鉴别语音的第二伪造分数,并基于所述第一伪造分数和所述第二伪造分数,确定出用于构造第四鉴别语音集合的待鉴别语音,并构造所述第四鉴别语音集合;
将所述第三鉴别语音集合与所述第四鉴别语音集合中均包括的待鉴别语音确定为伪造语音,并将所述待鉴别语音对应的目标声纹特征所属的目标人员确定为所述伪造语音对应的目标人员;
所述获取多个待鉴别语音,包括:
获取多个原始语音;
针对于每个原始语音,对该原始语音进行采样频率转换处理,将原始采样频率转换为第一采样频率的原始语音确定为待鉴别语音;
所述针对于所述第二鉴别语音集合中的每个待鉴别语音,提取该待鉴别语音的第二鉴别声纹特征和第二伪造语音特征,包括:
对所述第二鉴别语音集合中的每个待鉴别语音进行降采样处理,得到降采样后的第二鉴别语音集合;其中,降采样后的第二鉴别语音集合中每个待鉴别语音的第一采样频率转换为第二采样频率;
针对于降采样后的第二鉴别语音集合中的每个待鉴别语音,提取该待鉴别语音的第二鉴别声纹特征和第二伪造语音特征。
2.根据权利要求1所述的识别方法,其特征在于,所述针对于每个待鉴别语音,基于该待鉴别语音的第一鉴别声纹特征,确定该待鉴别语音与每个候选声纹特征之间的第一声纹相似度,包括:
针对于每个待鉴别语音,将该待鉴别语音的第一鉴别声纹特征,输入至预先训练好的第一声纹识别模型中,计算该待鉴别语音与每个候选声纹特征的第一声纹相似度。
3.根据权利要求1所述的识别方法,其特征在于,所述利用所述第一声纹相似度大于预设第一分数阈值的待鉴别语音构造第一鉴别语音集合,并确定所述第一鉴别语音集合中每个待鉴别语音对应的目标声纹特征,包括:
针对于每个待鉴别语音,从确定出的该待鉴别语音与每个候选声纹特征之间的第一声纹相似度中,确定出最大第一相似度;
当最大第一相似度大于预设第一分数阈值时,将该待鉴别语音确定为用于构造第一鉴别语音集合的待鉴别语音;
基于用于构造第一鉴别语音集合的待鉴别语音,构建第一鉴别语音集合;
将最大第一相似度对应的候选声纹特征,确定为该待鉴别语音的目标声纹特征。
4.根据权利要求1所述的识别方法,其特征在于,所述基于所述第一鉴别语音集合中每个待鉴别语音的第一伪造语音特征,确定所述第一鉴别语音集合中每个待鉴别语音的第一伪造分数,并利用所述第一伪造分数大于预设第二分数阈值的待鉴别语音构造第二鉴别语音集合,包括:
针对于所述第一鉴别语音集合中每个待鉴别语音,将该待鉴别语音的第一伪造语音特征,输入至预先训练好的第一伪造语音识别模型中,计算该待鉴别语音的第一伪造分数;
针对于所述第一鉴别语音集合中每个待鉴别语音,当所述第一伪造分数大于预设第二分数阈值时,将该待鉴别语音确定为用于构造第二鉴别语音集合的待鉴别语音;
基于用于构造第二鉴别语音集合的待鉴别语音,构建第二鉴别语音集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110759437.3/1.html,转载请声明来源钻瓜专利网。