[发明专利]一种语种识别模型的训练方法及语种识别方法有效
申请号: | 201410336650.3 | 申请日: | 2014-07-15 |
公开(公告)号: | CN105280181B | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 周若华;王宪亮;颜永红;索宏彬 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种语种识别模型的训练方法及语种识别方法,包括:提取训练语音数据的音素后验概率,将音素后验概率转换到对数域,进行降维和均值方差规整得到音素相关特征;利用音素相关特征计算Baum‑Welch统计量,利用Baum‑Welch统计量提取音素变化量因子;对音素变化量因子进行建模,建立SVM模型(语种识别模型);将待识别语音数据的音素变化量因子对SVM模型进行打分,对得分进行均值方差规整,并对规整后的得分使用线性鉴别性分析和高斯后端规整进行得分校正,得到最终识别结果。该方法与传统的语种识别方法相比,降低了计算复杂度,语种识别性能得到明显提升,具有很高的实用性。 | ||
搜索关键词: | 一种 语种 识别 模型 训练 方法 | ||
【主权项】:
1.一种语种识别模型的训练方法,包括:步骤1‑1),采集一定数量的目标语种语音数据作为训练语句,提取训练语句的音素后验概率;步骤1‑2),将音素后验概率转到对数域,并进行降维,对降维后的特征进行均值方差规整,得到音素相关特征;步骤1‑3),利用音素相关特征计算Baum‑Welch统计量;步骤1‑4),利用Baum‑Welch统计量提取音素变化量因子;步骤1‑5),对音素变化量因子进行建模,建立语种识别模型;所述步骤1‑4)的计算过程为:第i个训练语句的音素变化量因子w为:w=(I+TTΣ‑1N(i)T)‑1TTΣ‑1F(i)其中,N(i)为对角矩阵,对角线上元素为NcI,F(i)由一阶Baum‑Welch统计量Fc拼接得到,Σ和T在因子分析过程中由期望最大化算法训练得到;所述步骤1‑5)的过程为:采用一对一和一对多策略,使用支持向量机对音素变化量因子进行建模,建立支持向量机模型,支持向量机模型为所述的语种识别模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410336650.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种家庭情绪管理的装置和方法
- 下一篇:一种消声装置