[发明专利]一种基于维特比算法的花洒语音识别系统及方法在审
申请号: | 201911018314.3 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110738988A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 吴淼;唐刚 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L15/22;B05B12/08;B05B12/10 |
代理公司: | 31323 上海元好知识产权代理有限公司 | 代理人: | 张妍;刘琰 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 花洒 维特比算法 音频数据 采集 语音识别系统 语音识别应用 用户体验度 文字转化 | ||
1.一种基于维特比算法的花洒语音识别方法,其特征在于,包括以下步骤:
步骤1:采集用户发出的音频数据;
步骤2:基于维特比算法将所采集的音频数据识别为文字;
步骤3:将所识别的文字转化为包括开关花洒和控制水温的动作。
2.如权利要求1所述的基于维特比算法的花洒语音识别方法,其特征在于,所述步骤2包括:
步骤2.1:对所采集的音频数据进行降噪预处理;
步骤2.2:对降噪处理后的音频数据进行特征提取,以提取一组或几组能够描述音频数据特征参数;
步骤2.3:基于维特比算法,对提取后的特征参数进行解码,获取最优的文字识别结果。
3.如权利要求2所述的基于维特比算法的花洒语音识别方法,其特征在于,所述步骤2.1包括以下步骤:
步骤2.1.1:对所采集的音频数据进行首尾端的静音切除;
步骤2.1.2:对切除后的音频数据进行分帧处理;
步骤2.2.3:对分帧处理后的音频数据,从噪声背景中提取有用的语音信号,以抑制、降低噪声干扰。
4.如权利要求2所述的基于维特比算法的花洒语音识别方法,其特征在于,步骤2.1.2中,使用移动窗函数进行分帧,各帧之间具有交叠。
5.如权利要求2所述的基于维特比算法的花洒语音识别方法,其特征在于,步骤2.2中,所述特征参数包括平均能量、过零数、线性预测倒谱系数和梅尔频率倒谱系数。
6.如权利要求2所述的基于维特比算法的花洒语音识别方法,其特征在于,步骤2.3中,解码过程中,基于维特比算法,利用声学模型、发音字典及语言模型构建WFST搜索空间,在WFST搜索空间内寻找匹配概率最大的最优路径,得到最优的文字识别结果。
7.如权利要求6所述的基于维特比算法的花洒语音识别方法,其特征在于,所述声学模型所采用的训练方法为动态时间规整法、矢量量化法、隐马尔科夫模型法、人工神经网络法、支持向量机法或小波变换法。
8.一种基于维特比算法的花洒语音识别系统,其特征在于,包括:
数据采集模块,用于采集用户发出的音频数据;
语音识别模块,用于基于维特比算法将所采集的音频数据识别为文字;
控制模块,用于将所识别的文字转化为包括开关花洒和控制水温的动作。
9.如权利要求8所述的基于维特比算法的花洒语音识别系统,其特征在于,所述语音识别模块包括:
信息预处理模块,用于对所采集的音频数据进行降噪预处理;
特征提取模块,用于对降噪处理后的音频数据进行特征提取,以提取一组或几组能够描述音频数据特征参数;
模型训练模块,用于通过训练得到声学模型、语言模型及预设发音字典;
模式匹配模块,基于维特比算法,对提取后的特征参数进行解码,解码过程中,利用声学模型、发音字典及语言模型构建WFST搜索空间,在WFST搜索空间内寻找匹配概率最大的最优路径,得到最优的文字识别结果。
10.如权利要求9所述的基于维特比算法的花洒语音识别系统,其特征在于,所述信息预处理模块包括:
静音切除模块,用于对所采集的音频数据进行首尾端的静音切除;
分帧处理模块,用于对切除后的音频数据进行分帧处理;
降噪处理模块,用于对分帧处理后的音频数据,从噪声背景中提取有用的语音信号,以抑制、降低噪声干扰。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911018314.3/1.html,转载请声明来源钻瓜专利网。