[发明专利]一种智能化跨语言语音识别转化方法有效
申请号: | 201711371095.8 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107945805B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 程海波;文向东;于晓;赵季辉;李亮 | 申请(专利权)人: | 北京烽火万家科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/18;G10L15/10;G10L15/02;G10L15/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 张建纲 |
地址: | 100085 北京市海淀区安*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能化 语言 语音 识别 转化 方法 | ||
1.一种智能化跨语言语音识别转化方法,其特征在于:
步骤一:获取待识别转化的语音数据以及语音数据库;
步骤二:依据语音数据的属性数据对语音数据进行预处理,与语音数据库中的语音数据初步比对,识别出语音数据所属的语言语系;
步骤三:对初步识别出语言语系的语音数据进行判断纠正,如果语言语系识别出现错误,返回步骤二,如果正确,进入步骤四;
步骤四:对识别出语言语系的语音数据进行边界分割,针对不同语言语系的语音数据的特点,决策出当前语音数据所属的具体语种;
步骤五:基于声线模型对语音数据的音频特征进行识别,根据音频特征的归一化表示将语音数据转写为文本数据;
步骤六:对转化后的文本数据进行基于正则文法的处理,对文本进行消歧处理,规范文本的语义规则;
步骤七:建立消歧后的文本数据与原始的待识别转化的语音数据的映射关系,将待识别的语音数据存储至语音数据库中;
所述语音数据库中的样本语言数据事先进行训练与聚类分析,首先,记录样本语言数据的语言表现序列,预设语言表现集合,获取每一个样本语言数据的语言表现序列的长度,使用上层标记序列在语言表现序列与预设语言表现集合之间建立映射关系,确定出样本语言数据所属的语言表现类别,建立相应的类别表存储在语音数据库中,其中的类别表内部具体表明了语言语系与具体语种之间的映射包含关系,同时语系与语系之间通过类间距离计算描述语系之间的相似度。
2.如权利要求1的一种智能化跨语言语音识别转化方法,其特征在于:
所属待识别转化的语音数据可通过由用户通过话筒等语音输入设备输入,或从网上下载或本地导入语音资料文件。
3.如权利要求1的一种智能化跨语言语音识别转化方法,其特征在于:
所述步骤二中依据语音数据的属性数据对语音数据进行预处理包括:
对待识别转化的语音数据进行高频部分的升高,平滑频谱信号,增加高频分辨率;
采用可移动的有限长度窗口进行加权的方法对语音数据进行帧划分,以减少起始和结束处信号的间断性;
设定语音能量门限阈值,大于这个门限阈值的语音帧就当作有用的语音帧提取出来,否则就舍弃该语音帧;
对语音数据的信号进行分割和噪声的清除;
所述步骤二中识别出语音数据所属的语言语系,所述语言语系包括:印欧语系、南岛语系、高加索语系、汉藏语系、阿尔泰语系、北美印第安语系等;通过提取预处理过后的语音数据的语调、语速、噪音等语音特征参数,与语音数据库内部的类别表中的语音特征进行比对,初步筛选出特征综合相似度>80%的语言语系,并将相似度最高的语言语系作为备选语言语系。
4.如权利要求1的一种智能化跨语言语音识别转化方法,其特征在于:所述步骤三中对初步识别出语言语系的语音数据进行判断纠正,包括:
将待识别的语音数据作为输入队列通过全极点系统模型,得到后续输出,进行线性预测之后,进行样本信号逼近的方式,对特征参数进行估计,其中的特征参数包括MFCC特征参数和SDC特征参数,如果特征参数的相似度与预处理识别出的语系的相似度>90%,则判断语系识别正确,否则,语系识别错误;
所属步骤三中,如果语言语系识别出现错误,返回步骤二包括:
如果针对待识别语音数据所初步识别的语音语系出现错误,则根据语音数据库中针对语系内部之间的类内距离,将与预处理识别的语音语系间类间距离最小的一门语系再次识别为待识别语音数据所属的语系,如果不符合,则依次计算新识别出的语系与其他语系的类间距离,选择类间距离最小的一门语系作为识别待识别语音数据所属的语系,直至识别出待识别语音数据所属的语系。
5.如权利要求1的一种智能化跨语言语音识别转化方法,其特征在于:
所述对识别出语言语系的语音数据进行边界分割,包括:
指根据语音动作序列,将语音数据分割成时序相邻的一系列与语音学动作单元相应的音段,并将相应的时问信息特征添加到动作文件里;
所述语音学动作单元包括:音素,音节,单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京烽火万家科技有限公司,未经北京烽火万家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711371095.8/1.html,转载请声明来源钻瓜专利网。