[发明专利]一种数字串语音处理方法及装置有效
申请号: | 201811609029.4 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109448732B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 闫杰;李晋;方昕 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/08;G10L17/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种数 字串 语音 处理 方法 装置 | ||
1.一种数字串语音处理方法,其特征在于,包括:
获取目标数字串语音;
基于整个所述目标数字串语音和预先建立的身份向量确定模型,确定所述目标数字串语音中各个数字对应的目标数字身份向量,所有目标数字身份向量组成所述目标数字串语音对应的数字声纹模型;
其中,所述身份向量确定模型采用数字串语音训练得到,所述数字声纹模型中包含所述数字串语音中数字串的结构化信息;
所述基于整个所述目标数字串语音和预先建立的身份向量确定模型,确定所述目标数字串语音中各个数字对应的目标数字身份向量,包括:
获取所述目标数字串语音对应的频域特征;基于所述身份向量确定模型,将所述目标数字串语音对应的频域特征处理为频域上的多个特征,并将所述频域上的多个特征转换为时域上的多个特征,根据所述时域上的多个特征确定所述目标数字串语音中各个数字对应的目标数字身份向量。
2.根据权利要求1所述的数字串语音处理方法,其特征在于,所述身份向量确定模型的训练过程包括:
获取所述数字串语音中各个数字的起始位置信息和结束位置信息;
获取整个所述数字串语音对应的频域特征;
利用整个所述数字串语音对应的频域特征,以及所述数字串语音中各个数字的起始位置信息和结束位置信息,训练并构建身份向量确定模型。
3.根据权利要求2所述的数字串语音处理方法,其特征在于,所述身份向量确定模型为卷积神经网络;
将整个所述数字串语音对应的频域特征,以及所述数字串语音中各个数字的起始位置信息和结束位置信息,输入身份向量确定模型进行训练,包括:
通过所述身份向量确定模型的卷积层和第一池化层,将整个所述数字串语音对应的频域特征映射为频域上的多个第一特征;
通过所述身份向量确定模型的反卷积层,将所述频域上的多个第一特征转换为时域上的多个第二特征,其中,任一所述第二特征的长度与所述数字串语音的帧数相同,任一所述第一特征的长度小于任一所述第二特征的长度;
基于所述数字串语音中各个数字的起始位置信息和结束位置信息,通过所述身份向量确定模型的第二池化层,从所述多个第二特征中分别获取各个数字对应的特征片段,基于所述各个数字对应的特征片段确定所述数字串语音中各个数字对应的数字身份向量;
通过所述身份向量确定模型的分类层,对所述数字串语音中各个数字对应的数字身份向量进行分类,分类结果作为所述数字串语音对应的身份标签。
4.根据权利要求3所述的数字串语音处理方法,其特征在于,所述基于所述各个数字对应的特征片段确定所述数字串语音中各个数字对应的数字身份向量,包括:
对于所述数字串语音中的任一数字,将分别从所述多个第二特征中获取的、该数字对应的特征片段求平均,获得多个特征值,所述多个特征值组成该数字对应的数字身份向量,以得到所述数字串语音中各个数字对应的数字身份向量。
5.根据权利要求1~4中任意一项所述的数字串语音处理方法,其特征在于,还包括:
确定所述目标数字串语音对应的数字声纹模型与注册数字串语音对应的数字声纹模型的匹配度,其中,所述注册数字串语音对应的数字声纹模型预先基于所述身份向量确定模型确定;
若所述匹配度大于预设值,则确定所述目标数字串语音与所述注册数字串语音对应的用户身份一致。
6.根据权利要求5所述的数字串语音处理方法,其特征在于,预先基于所述身份向量确定模型确定所述注册数字串语音对应的数字声纹模型,包括:
获取注册数字串语音,所述注册数字串语音中至少包括所述目标数字串语音所包含的各个数字;
基于所述注册数字串语音和所述身份向量确定模型,确定所述注册数字串语音中各个数字对应的注册声纹特征;
将同一数字对应的注册声纹特征求平均,获得所述注册数字串语音中多个不同数字分别对应的注册声纹特征,所述注册数字串语音中多个不同数字分别对应的注册声纹特征组成所述注册数字串语音对应的数字声纹模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811609029.4/1.html,转载请声明来源钻瓜专利网。