[发明专利]说话人识别方法、装置和系统有效
申请号: | 201010572201.0 | 申请日: | 2010-12-03 |
公开(公告)号: | CN102486922A | 公开(公告)日: | 2012-06-06 |
发明(设计)人: | 王磊;鲁耀杰;史达飞;尹悦燕;郑继川 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 识别 方法 装置 系统 | ||
1.一种使用帧选择和自适应高斯混合模型选择的说话人识别方法,包括步骤:
a.从输入语音文件中抽取语音帧的声学特征;
b.利用抽取的声学特征通过使用语音检测技术过滤掉不包含人类语音的帧;
c.对于步骤b得到的帧,进行帧选择以利用说话人语音帧的声学特征,选择对不同说话人区分度高的帧,并过滤掉区分度低的帧;
d.利用步骤c中保留的帧的声学特征,选择对不同说话人区分度高的高斯混合模型,并过滤掉区分度低的高斯混合模型;
e.计算步骤c中保留的帧与步骤d保留的每个说话人的高斯混合模型的最大似然得分,并根据每个说话人的高斯混合模型最大似然得分来产生说话人识别结果。
2.如权利要求1所述的方法,其中,步骤c包括步骤:
对于步骤b得到的帧中的每个帧,计算每个高斯混合和每个帧的最大似然得分以及统一背景模型和每个帧的最大似然得分;
根据所述最大似然得分,针对每个帧计算每个高斯混合模型和统一背景模型的似然熵;以及
当步骤b得到的帧中的某一个的似然熵大于似然熵阈值时,丢弃该帧。
3.如权利要求2所述的方法,其中,似然熵阈值设置为0.5。
4.如权利要求1所述的方法,其中,步骤d包括步骤:
对于每个说话人的高斯混合模型,计算每个高斯混合模型根据步骤c保留的帧的最大似然得分与统一背景模型根据步骤c保留的帧的最大似然得分之差;
计算针对每个高斯混合模型的累积最大似然得分;
对每个高斯混合模型的累积最大似然得分进行排序;以及
保留累积最大似然得分大于累积和阈值的高斯混合模型。
5.如权利要求4所述的方法,其中,步骤d进一步包括步骤:
采用如下公式将没有选中的高斯混合模型的权重根据选中的高斯混合模型的最大似然得分排序重新分配给选中的高斯混合模型,
其中,X代表步骤d最终选中的高斯混合模型数量,Rank是高斯混合模型最大似然得分的排名,Rank为自然数,对于最大似然得分最大的高斯混合模型,其Rank值为1;其次为2;最大似然得分最小的高斯混合模型,其Rank值为X。
6.如权利要求1所述的方法,其中,步骤e包括:根据重新分配的权重,计算步骤c中保留的帧与步骤d保留的每个说话人的高斯混合模型的最大似然得分,并将高斯混合模型的最大似然得分最高的说话人作为最终的识别结果。
7.如权利要求1-6所述的方法,其中,步骤a中所提到的声学特征可以是抽取频谱特征的方法、梅尔频标倒谱参数的方法、线性预测系数的方法、或线性预测倒谱系数的方法。
8.如权利要求1-6所述的方法,其中,步骤b中所提到的语音检测技术可以使用支持向量机SVM技术。
9.一种使用帧选择和自适应高斯混合模型选择的说话人识别装置,包括:
帧选择单元,利用说话人语音帧的声学特征,选择对不同说话人区分度高的帧,并过滤掉区分度低的帧;
高斯混合模型选择单元,利用来自帧选择单元的帧的声学特征,选择对不同说话人区分度高的高斯混合模型,并过滤掉区分度低的高斯混合模型;和
说话人识别单元,计算帧选择单元保留的帧与高斯混合模型选择单元保留的每个说话人的高斯混合模型的最大似然得分,并根据每个说话人的高斯混合模型最大似然得分来产生说话人识别结果。
10.如权利要求9所述的装置,其中,所述帧选择单元包括:
计算单元,对于每个帧,计算每个高斯混合和每个帧的最大似然得分以及统一背景模型和每个帧的最大似然得分;并根据所述最大似然得分,针对每个帧计算每个高斯混合模型和统一背景模型的似然熵;以及
选择单元,当从计算单元得到的帧的似然熵大于似然熵阈值时,丢弃该帧。
11.如权利要求10所述的装置,其中,似然熵阈值设置为0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010572201.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:粗纱车的精准定长系统
- 下一篇:磁转子和铜转子间隙可自行改变的磁力偶合器