[发明专利]一种声纹识别方法、装置、终端及存储介质在审
申请号: | 202310485536.6 | 申请日: | 2023-04-28 |
公开(公告)号: | CN116417001A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 谭泉;潘俊 | 申请(专利权)人: | 王力安防科技股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/08;G10L17/14;G10L19/02;G10L21/0208 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 刘静 |
地址: | 321300 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 终端 存储 介质 | ||
1.一种声纹识别方法,其特征在于,包括:
获取测试语音和训练语音,所述测试语音和训练语音均包括多个语音特征;
将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;
利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。
2.根据权利要求1所述的声纹识别方法,其特征在于,所述声纹模型包括包括:声纹背景子模型、声纹分类子模型及声纹识别子模型,其中,
声纹背景子模型,用于滤除输入语音的背景噪声;
声纹分类子模型,用于对输入语音进行分类,其中,每个语音样本均对应有一个类别标签;
声纹识别子模型,用于对输入语音进行声纹目标识别。
3.根据权利要求2所述的声纹识别方法,其特征在于,所述声纹模型中任意一个子模型的训练过程均包括:
获取预设语音集,所述预设语音集包括多个语音样本;
采用小波变换对预设语音集进行分解,提取多个语音样本特征对应的小波熵;
将所述小波熵输入预设神经网络训练声纹子模型中进行训练,当满足预设条件时,得到训练好的声纹子模型。
4.根据权利要求3所述的声纹识别方法,其特征在于,所述声纹分类子模型通过EM估计算法验证该子模型是否完成训练。
5.根据权利要求3所述的声纹识别方法,其特征在于,所述声纹识别子模型通过MAP算法验证该子模型是否完成训练。
6.根据权利要求3所述的声纹识别方法,其特征在于,所述预设神经网络为卷积神经网络,其结构包括:输入层、第一隐藏层、第二隐藏层、第三隐藏层、第四隐藏层及输出层,后验概率矩阵为预设神经网络的输出。
7.根据权利要求1所述的声纹识别方法,其特征在于,所述语音特征包括:语音频率、语音分贝、语音的语义及语音字符的数量。
8.一种声纹识别装置,其特征在于,包括:
获取模块,用于获取测试语音和训练语音,所述测试语音和训练语音均包括多个语音特征;
训练模块,用于将测试语音和训练语音分别输入到训练好的声纹模型中,获得测试语音中多个语音特征分别对应预设语音特征的第一后验概率矩阵,及训练语音中多个语音特征分别对应预设语音特征的第二后验概率矩阵;
识别模块,用于利用CDS相似度算法,对第一后验概率矩阵及第二后验概率矩阵进行相似度比较,得到所述测试语音的声纹识别结果。
9.一种终端,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7任一所述的声纹识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7任一所述的声纹识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王力安防科技股份有限公司,未经王力安防科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310485536.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低内阻锂电池生产工艺
- 下一篇:缝隙天线组件及电子设备