[发明专利]一种说话人识别方法、装置、设备及存储介质在审
申请号: | 202010349219.8 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111508505A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 钟奥;王建社;冯祥;余巍;董德武;张建忠;程彪 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 说话 识别 方法 装置 设备 存储 介质 | ||
1.一种说话人识别方法,其特征在于,包括:
获取待识别语音;
以趋于由混合高斯模型针对所述待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,其中,所述混合高斯模型采用多个说话人的多条语音数据训练得到,所述混合高斯模型能够对语音数据中说话人个性特征的分布进行描述;
根据所述目标说话人特征,识别所述待识别语音对应的说话人。
2.根据权利要求1所述的说话人识别方法,其特征在于,所述以趋于由混合高斯模型针对所述待识别语音确定的说话人特征为获取方向,从待识别语音中获取目标说话人特征,包括:
利用预先建立的说话人特征提取模型,从所述待识别语音中提取目标说话人特征;
其中,所述说话人特征提取模型利用所述多个说话人的多条语音数据以及所述混合高斯模型构建,每条语音数据对应有真实说话人标签。
3.根据权利要求2所述的说话人识别方法,其特征在于,所述说话人特征提取模型的构建过程包括:
分别对所述多个说话人的多条语音数据提取声学特征,以得到所述多个说话人分别对应的声学特征;
利用所述混合高斯模型和所述多个说话人分别对应的声学特征,确定所述多个说话人分别对应的说话人特征,作为所述多个说话人分别对应的真实说话人特征;
利用所述多个说话人分别对应的声学特征、所述多个说话人分别对应的真实说话人特征以及所述多个说话人的多条语音数据的真实说话人标签,构建说话人特征提取模型。
4.根据权利要求3所述的说话人识别方法,其特征在于,利用所述混合高斯模型和所述多个说话人分别对应的声学特征,确定所述多个说话人分别对应的真实说话人特征,包括:
利用所述混合高斯模型和所述多个说话人分别对应的声学特征,确定所述多个说话人分别对应的高阶统计量,作为所述多个说话人分别对应的真实说话人特征;
其中,所述高阶统计量包括以下统计量中的一种或多种:均值、标准差、峰度、斜度。
5.根据权利要求4所述的说话人识别方法,其特征在于,所述利用所述混合高斯模型和所述多个说话人分别对应的声学特征,确定所述多个说话人分别对应的高阶统计量,包括:
根据所述多个说话人分别对应的声学特征,以及,每个说话人对应的声学特征的分布属于所述混合高斯模型中高斯函数的概率,确定所述多个说话人分别对应的高阶统计量。
6.根据权利要求3所述的说话人识别方法,其特征在于,所述利用所述多个说话人分别对应的声学特征、所述多个说话人分别对应的真实说话人特征以及所述多个说话人的多条语音数据的真实说话人标签,构建说话人特征提取模型,包括:
由所述多个说话人分别对应的声学特征组成训练样本集,其中,所述训练样本集中的一个训练样本为一个说话人对应的声学特征,所述训练样本集中的每个训练样本对应有真实说话人特征和真实说话人标签,一训练样本对应的真实说话人特征为该训练样本对应的说话人所对应的真实说话人特征,一样本对应的真实说话人标签为该训练样本对应的说话人的语音数据所对应的真实说话人标签;
以所述训练样本集中每个训练样本对应的真实说话人特征和真实说话人标签为依据,利用所述训练样本集中的训练样本,训练说话人特征提取模型,以得到构建的说话人特征提取模型。
7.根据权利要求6所述的说话人识别方法,其特征在于,所述以所述训练样本集中每个训练样本对应的真实说话人特征和真实说话人标签为依据,利用所述训练样本集中的训练样本,训练说话人特征提取模型,包括:
对于所述训练样本集中的每个训练样本:
将该训练样本输入说话人特征提取模型,得到说话人特征提取模型预测的说话人特征,预测的说话人特征作为该训练样本对应的预测说话人特征;
根据该训练样本对应的预测说话人特征预测说话人标签,预测的说话人标签作为该训练样本对应的预测说话人标签;
以得到所述训练样本集中每个训练样本对应的预测说话人特征和预测说话人标签;
根据所述训练样本集中每个训练样本对应的预测说话人特征、真实说话人特征、预测说话人标签以及真实说话人标签,更新说话人特征提取模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010349219.8/1.html,转载请声明来源钻瓜专利网。