[发明专利]一种语音控制准确率的调整方法及系统在审
申请号: | 201910030821.2 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109448726A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 李庆湧 | 申请(专利权)人: | 李庆湧 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/06 |
代理公司: | 深圳余梅专利代理事务所(特殊普通合伙) 44519 | 代理人: | 井杰;高真辉 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 准确率 语音控制 匹配 神经网络模型 预处理 控制信号输入 语音控制指令 调整模式 神经网络 受控设备 特征提取 网络模型 信号执行 用户启动 用户语音 语音识别 初始化 预存 送入 监控 分类 改进 网络 | ||
本发明提供了一种语音控制准确率的调整方法和系统,该方法通过以下步骤实现:选择特定的神经网络模型,对网络的权值初始化;监控是否有用户语音控制信号输入;对输入信号执行预处理;信号经特征提取后,送入训练好的神经网络,得到分类的识别结果;判断该识别结果与系统预存的语音控制指令是否匹配;匹配时,执行相应控制操作;不匹配时,计算语音控制准确率;当语音控制准确率低于预定值或用户启动调整过程时,系统进入准确率调整模式;重新对网络模型进行训练,直至准确率高于设定值。本发明可以根据需要实时对模型进行训练,调整语音控制准确率,提高对受控设备控制的可靠性;同时利用本发明中的改进神经网络模型,提高了语音识别精度。
技术领域
本发明涉及语音控制技术领域,尤其涉及一种语音控制方法和系统。
背景技术
随着语音识别、人机交互技术的发展与成熟,越来越多的设备采用语音控制。被控设备通过语音采集装备,获取用户语音信号,与贮存的控制命令的语音资料作比对匹配,进行语音识别,解析后将指令发送至控制单元,控制设备进行相关操作。其中,语音识别的精度直接关系到了语音控制的准确率,但目前存在的主要问题是语音识别率不高,无法识别用户命令或错误识别用户命令,存在系统误操作的问题。
现有技术中语音识别系统基本由4部分构成:预处理、特征提取、模型库和模式匹配。系统框图如附图1所示语音信号经过处理得到的语音波形,首先需要进行预处理操作。预处理操作主要包括语音信号的预加重、信号的分帧、语音信号的加窗以及语音信号的端点检测;语音信号经过预处理后,接着要对语音信号的重要参数进行特征提取;特征提取后的信号经过训练与模型库中的数据进行匹配,最终得到语音识别的结果。
人工神经网络的研究一直是个热潮,因其非线性、自适应、鲁棒性及学习特性并且易于硬件实现等特点而受到人们的极大关注。对于语音信号的处理和识别,由于神经网络的结构与人耳耳蜗的层次和连接极其相似,因此神经网络模型的独特优点和超强的分类和映射能力能够充分借鉴和探索人的听觉神经机理,对神经网络和耳蜗模型互相结合的研究将是改进现有语音识别系统性能的重要方向。近些年,随着信号处理和机器学习领域的发展,语音识别研究已经取得了很大的成功,包括高斯混合模型、隐马尔可夫模型和深层神经网络等技术在内的方法已经获得很高的识别准确率。现阶段是语音识别研究的黄金时期,吸引了诸多科技公司和科研机构。国外像谷歌、微软、苹果等公司都相继推出了基于深度学习的语音识别服务,国内一批企业也纷纷跟进。
但目前的基于神经网络算法的语音识别算法也存在一些弊端。例如一个简单的问题通常需要几百倍甚至上千倍的迭代训练,要耗费大量的时间,网络训练时间长;再如局部极小值问题普遍存在于神经网络的优化过程中;在噪声环境下的性能却仍然不尽如人意,且现有算法针对不同噪声的效果差异很大;用户本身说话带有口音或者使用了方言、说话人本身的说话含糊或者不清楚等,也可能造成语音识别效果变差。
发明内容
为解决上述影响语音识别率的问题,对此本发明提供一种语音控制准确率的调整方法和系统。本发明的技术方案:
一种语音控制准确率的调整方法,包括步骤:
S1:根据语音控制的特点,选择特定的神经网络模型,采集用户的语音信息经特征提取后对模型进行训练,使用已经训练好的参数对网络的权值初始化;根据控制系统的功能和控制需求,设置语音控制指令集;
S2:获得所在环境声音信号,将时域信号转化为频域信号,计算信号的能量谱;将信号的能量谱与背景噪声能量谱比较,判断是否存在用户语音控制信号输入;若存在用户语音控制信号输入,执行之后步骤;否则,继续监听环境声音信号;
S3:获取用户语音控制信号,对该信号执行预处理步骤,预处理步骤包括:抗混叠滤波步骤;预加重步骤;加窗分帧步骤和端点检测步骤;
S4:将预处理后的用户语音控制信号作为输入,经过特征提取后,送入训练好的神经网络中,得到分类的识别结果即用户的语音控制命令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李庆湧,未经李庆湧许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910030821.2/2.html,转载请声明来源钻瓜专利网。