[发明专利]一种基于拼接特征的语种识别方法有效
申请号: | 202010244083.4 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111599344B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 刘俊南;江海;王化;刘文龙 | 申请(专利权)人: | 因诺微科技(天津)有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300392 天津市滨海新区华苑产业*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 拼接 特征 语种 识别 方法 | ||
本发明公开了一种基于拼接特征的语种识别方法,步骤1,获得语音信号的帧序列;步骤2,计算时长特征;步骤3,提取语音帧序列的底层声学特征;步骤4,得到音素特征序列;步骤5,获得拼接特征;步骤6,将拼接特征输入到i‑vector提取器中,提取得到语音帧序列的i‑vector特征表示;步骤7,得到lda‑vector特征;步骤8,将lda‑vector特征输入到训练好的分类器中,获得输入语音帧序列的语种标签。与现有技术相比,本发明结合了高层和底层声学特征这两种特征的优点;无需训练多个音素识别器,只需要提取高层声学特征;降低复杂度的同时,提高对语音信号的语种识别性能特别是语种识别准确率。
技术领域
本发明涉及语音识别技术领域,特别涉及一种应用于语种识别的语种特征提取方法。
背景技术
语种识别是指判定输入语音所属语种类别的技术,作为机器自动翻译系统、语音识别系统的前端处理技术,在国际化服务转接方面具有重要价值。特别是近年来网络巨头公司的国际化、大数据的蓬勃发展,越来越需要用到语种识别来进行分别服务。
当前语种识别主流技术包括:基于全差异空间分析方法的i-vector方法、基于语音识别技术的PPRLM(并行音素识别语法模型)方法以及基于神经网络的embedding方法。其中基于语音识别技术的PPRML方法更被认为是最有发展的技术方法。针对现有的语种识别方法,使用PPRLM方法的系统虽然能够提取高层声学特征,在短语音上性能能够超过全差异空间分析方法,但PPRML方法需要训练多个语种的音素识别器,并且在长语音上效果并不比全差异空间分析方法更好。
如图1所示,为传统的语种识别方法示意图。该方法具体为一种基于全差异空间分析模型的语种识别方法,首先对待识别的语音数据进行分帧;提取其声学特征作为该方法的训练预料;训练全差异空间提取器,对训练预料进行i-vector提取;进行降维处理;然后使用Ida-vector训练分类器;当对新语音信号进行识别时,Ida-vector训练分类器对提取得到的i-vector特征进行语种的分类判别。传统基于全差异空间分析方法的语音识别系统直接使用底层声学特征,因此底层声学特征的选取对于识别准确率来说是相当重要的。目前的主流底层声学特征包括MFCC特征、FilterBank特征和PLP特征。底层声学特征主要用于描述语音信号的发音特点。但是底层声学特征不仅包含了音素区分信息,还包含了干扰语种信息的各种干扰如说话人、信道信息,并不能很好的描述语种特点。
高层特征能够体现音素上下文相关信息,并且是底层声学特征的优化,突出声学特征中的音素信息,而抑制其他干扰信息。如何利用高层特征实现语种识别方法是本发明亟待解决的技术问题。
发明内容
针对传统语种识别方法存在的缺陷,本发明旨在提出一种语种特征提取方法,利用声学特征、音素特征以及时长特征的拼接,结合全差异空间分析方法实现新的语种识别方法。
本发明的一种基于拼接特征的语种识别方法,包括以下步骤:
步骤1,对接收的输入语音信号进行分帧处理,获得语音信号的帧序列;
步骤2,计算输入语音信号的帧序列的总数,作为时长特征;
步骤3,提取语音帧序列的底层声学特征;
步骤4,将当前帧的前、后多帧底层声学特征与当前帧的底层声学特征进行拼接得到上下文扩展声学特征;,上下文扩展声学特征的拼接的具体处理包括:各帧声学特征、与对应的前T_l后T_r帧特征进行拼接得到维度为(T_l+T_r+1)*F的上下文扩展声学特征;
步骤5,将上下文扩展声学特征输入到训练好的音素识别神经网络中,利用音素识别器进行音素识别,得到音素特征序列;
步骤6,比较底层声学特征维度N和PLLR特征维度M,选择维度大者进行PCA 降维,然后以底层声学特征为目标进行归一化,再进行拼接,作为拼接特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因诺微科技(天津)有限公司,未经因诺微科技(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010244083.4/2.html,转载请声明来源钻瓜专利网。