[发明专利]一种语音关键词识别中扩增语料的选取方法有效
申请号: | 202010347536.6 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111554273B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 贺前华;汪星;严海康 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/07;G10L15/16;G10L15/22;G10L15/01;G10L21/013;G10L25/87 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 关键词 识别 扩增 语料 选取 方法 | ||
1.一种语音关键词识别中扩增语料的选取方法,其特征在于,包括下述步骤:
采用语音转换技术对含关键词的原始语音进行语音转化,得到生成语音,所述生成语音包括多个同一语义但不同说话人信息的语音;
对原始语音进行语音端点检测,去除静音部分,再获取原始语音和生成语音中含关键词的语音片段,分别表示为原始语音关键词片段和生成语音中关键词片段;
利用原始语音关键词片段分为男女两类样本,分别训练通用背景混合高斯模型UBMM、UBMF,再用第i个关键词的男女两类原始语音关键词片段分别训练混合高斯模型GMM(M,i)、GMM(F,i);
采用一种新的通过GMM模型进行二分类的方法对相应关键词i的生成语音x(i,j)进行性别分类:
采用GMM分离度度量方法判断GMM分量距离,将分离度较小的设为相似GMM分量,去除混合高斯模型GMM(M,i)、GMM(F,i)中相似的GMM分量,使用剩下的分离度较大的分量形成新的混合高斯模型GMM′(M,i)、GMM′(F,i),用新生成的混合高斯模型GMM′(b,i)、GMM′(g,i)对生成语音关键词片段进行男女分类,进而得到生成语音的性别信息;
借用轮廓系数评价思想对轮廓系数进行适合GMM模型的修改后,形成改进后的评价系数对生成语音中关键词片段进行评价,选取满足设定条件的生成语音作为训练样本。
2.根据权利要求1所述的语音关键词识别中扩增语料的选取方法,其特征在于,所述采用语音转换技术对含关键词的原始语音进行语音转化,具体步骤包括:
根据语音转换原理,音调变化在4到8个大调可以改变语音说话人性别,对男性语音进行-2到+8个大调的转换,女性语音进行-8到+2个大调的转换,使每一句含关键词语音得到多个同一语义但不同说话人信息的语音。
3.根据权利要求1所述的语音关键词识别中扩增语料的选取方法,其特征在于,所述对原始语音进行语音端点检测,去除静音部分,再获取原始语音和生成语音中含关键词的语音片段,具体步骤包括:
采用语音端点检测方法去除原始语音样本中的静音部分,再提取语音中关键词所在的语音片段,提取的语音片段时间为:
其中,设语音语义为Lz个字,总时长为Ls,关键词有a个字,关键词为第d到d+a-1个字。
4.根据权利要求1所述的语音关键词识别中扩增语料的选取方法,其特征在于,所述采用GMM分离度度量方法判断GMM分量距离,GMM分离度度量公式如下:
其中,∑(ui,j-uk,l)2为对模型Gi的第j个高斯函数和模型Gk的第l个高斯函数各维度均值的平方和,Πσi,j是指对模型Gi的第j个高斯函数各维度方差的积,Πσk,l是指对模型Gk的第l个高斯函数各维度方差的积。
5.根据权利要求1所述的语音关键词识别中扩增语料的选取方法,其特征在于,所述借用轮廓系数评价思想对轮廓系数进行适合GMM模型的修改后,形成改进后的评价系数对生成语音中关键词片段进行评价,具体采用GMM的后验概率代替样本与类之间的距离,后验概率越大,代表距离越小,修改后的表达式如下:
若计算类的轮廓系数,P(i)表示第i类样本在该类GMM模型中的后验概率的平均值,P(i)′表示第i类样本其它类GMM模型的平均后验概率的最大值;
若计算单个样本的轮廓系数,P(i)表示第i个样本在该类GMM模型中后验概率,P(i)′表示第i个样本到其它类GMM模型的后验概率的最大值,S(i)取值在[-1,1]之间,S越接近1,代表效果越好;
使用原始语音关键词片段得到第i个关键词类的轮廓系数Si,对单个生成语音片段x′(i,j)计算轮廓系数若则将该语音作为第i个关键词训练样本,反之则舍弃,其中,αi根据不同关键词类进行取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010347536.6/1.html,转载请声明来源钻瓜专利网。