[发明专利]一种语音识别方法在审
申请号: | 202010308379.8 | 申请日: | 2020-04-18 |
公开(公告)号: | CN111540362A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 张超;李勉勉 | 申请(专利权)人: | 张超 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/20;G10L15/02;G10L15/06;G10L15/16;G10L15/04 |
代理公司: | 郑州芝麻绘智知识产权代理事务所(普通合伙) 41191 | 代理人: | 符亚飞 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 | ||
本发明涉及一种语音识别方法,获取待识别的语音信号,对待识别的语音信号进行两种处理方式,第一种:进行高通滤波、周期性采样以及加窗及分帧处理,得到目标语音信号,对目标语音信号进行语音特征提取,得到目标语音信号的语音特征数据,将得到的语音特征数据输入至语音识别模型,获取与目标语音信号相对应的语音识别结果,第二种:对待识别的语音信号进行语音识别转换,得到对应的文本数据,最后,比较得到的语音识别结果与文本数据,若语音识别结果对应的语音关键字存在于文本数据中,则输出语音识别结果、文本数据和语音识别结果对应的语音关键字。通过比较两种不同的语音识别过程,能够提升语音识别的准确性,降低识别错误的可能性。
技术领域
本发明涉及一种语音识别方法。
背景技术
目前,语音识别技术得到了广泛的应用,语音识别技术通常为:操作人员说出能表达相关功能的命令词或者句子,设备对其进行语音识别,得到对应的控制指令,然后进行相关控制。但是,目前的语音识别方法虽然能够在一定程度上实现语音识别,但是,识别精度不是很高,很多时候会出现识别错误的情况。
发明内容
本发明的目的在于提供一种语音识别方法,用于解决目前的语音识别方法的识别精度不高的问题。
为了解决上述问题,本发明采用以下技术方案:
一种语音识别方法,包括:
获取待识别的语音信号;
对所述待识别的语音信号进行高通滤波处理;
对高通滤波处理后的所述待识别的语音信号进行周期性采样,得到预设频率的中间语音采样数据;
对所述中间语音采样数据进行加窗及分帧处理,得到目标语音信号;
对所述目标语音信号进行语音特征提取,得到所述目标语音信号的语音特征数据;
将得到的语音特征数据输入至语音识别模型,获取与所述目标语音信号相对应的语音识别结果;
对所述待识别的语音信号按照预设的语音识别算法进行语音识别转换,得到对应的文本数据;
比较所述语音识别结果与所述文本数据;
若所述语音识别结果对应的语音关键字存在于所述文本数据中,则输出所述语音识别结果、所述文本数据和所述语音识别结果对应的语音关键字;
其中,所述语音识别模型的建立过程包括:
获取初始训练样本,所述初始训练样本为初始语音信号;
对所述初始语音信号进行高通滤波处理;
对高通滤波处理后的所述初始语音信号进行周期性采样,得到预设频率的语音采样训练数据;
对所述语音采样训练数据进行加窗及分帧处理,得到目标训练样本;其中,所述目标训练样本包括语音关键字;
对所述目标训练样本进行语音特征提取,得到所述目标训练样本的语音特征数据;
基于卷积神经网络,将目标训练样本的语音特征数据作为输入,语音关键字作为输出,训练得到所述语音识别模型;所述语音识别模型用于表征语音特征数据与语音关键字的对应关系。
优选地,所述对所述待识别的语音信号按照预设的语音识别算法进行语音识别转换,得到对应的文本数据,包括:
在预设的语音坐标系内生成所述待识别的语音信号的语音波形图;
基于语音活性检测算法,从所述语音波形图中划分得到至少两个有效语音段;
通过语音特征识别算法提取各个所述有效语音段对应的语音特征曲线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张超,未经张超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010308379.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试管检测装置
- 下一篇:一种医疗保持架开孔设备及打孔修孔工艺