[发明专利]基于分形特征的智能轮椅语音识别控制方法及系统无效
申请号: | 201110109168.2 | 申请日: | 2011-04-28 |
公开(公告)号: | CN102184732A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 张毅;罗元;李敏;蔡军;谢颖;林海波;黄璜;李艳花 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 智能 轮椅 语音 识别 控制 方法 系统 | ||
技术领域
本发明涉及计算机语音识别控制领域,具体涉及一种基于分形特征的语音识别智能轮椅控制方法。
背景技术
随着社会的发展和人类文明程度的提高,人们特别是老年人、残疾人的服务需求会日益增加,他们愈来愈需要运用现代高新技术来改善他们的生活质量和生活自由度。无论是国际上还是我国国内,人口老龄化的进程正在加快,另外由于各种交通事故、天灾人祸和种种疾病,每年均有成千上万的人丧失一种或多种能力(如行走、动手能力等),这种社会现实促进了智能化服务机器人在助老、助残方面的应用。因此,智能轮椅作为助老、助残服务机器人系列产品中的一个重要研究领域已逐渐成为国内外科技人员研究的热点。轮椅作为广大老弱病残人员使用的辅助运动工具,几乎都是室外使用的手柄控制的电动轮椅,对于那些四肢活动能力受限的老年人或残疾者控制起来不是十分方便,因此,我们将语音控制应用于智能轮椅上,形成一种将智能轮椅与语音识别技术结合起来的新型代步工具,它不仅具有普通轮椅的所有功能,重要的是还可以通过语音命令对轮椅进行控制,使轮椅的控制更加简单、方便,宜人性更好。因此,实用的语音控制智能轮椅机器人将为老年人和残疾人开创新的生活模式和生活概念,具有非常重要的现实意义。
在国内外,研究者们已经开展了大量相关项目的研究:1996年西班牙由ONCE基金会资助的SIAMO项目,目标是根据用户的残障程度及特殊需求建造多功能系统,为了达到要求,特别研究了系统的模块化和灵活性,设计了分布式构架,也着重开发了人机界面,其中也把语音识别控制技术应用于智能轮椅,使用户更易于控制轮椅。日本北海道工业设计学院的研究人员研制出一种不用人工操作的声控轮椅。研究人员将可感应语言声响的晶片,装置在轮椅的控制机关内,在使用者对着麦克风讲出要求后,感应系统便会依照要求启动运作,除了可向前后左右和快慢行走外,椅背还可向后倾,方便使用者休息。中国科学院自动化研究所承担了“863”智能机器人智能轮椅项目,研制了一种具有视觉和口令导航功能并能与人进行语音交互的机器人轮椅NLPR,此项研究高度重视了智能轮椅人机控制界面的设计,在轮椅的设计中综合运用模式识别实验室有关图像处理、计算机视觉和语音识别等最新成果,使人能通过语音控制轮椅自由行走,轮椅可以实现简单的人机对话功能。上海交通大学开发成功一种声控轮椅,主要是为四肢全部丧失功能的残疾者设计,使用者只需发出“开”、“前”、“后”、“左”、“右”、“快”、“慢”、“停”等指令,轮椅可在1.2秒内按指令执行。但是,由于语音信号是一个复杂的非线性过程,那么基于传统的线性系统理论发展起来的语音识别技术的性能就难以进一步的提高。
因此急需一种采用高识别率的语音识别系统来控制智能轮椅的方法。
发明内容
有鉴于此,为了解决上述问题,本发明提出一种采用高识别率的语音识别系统来控制智能轮椅的方法。是一种基于非线性理论的特征提取方法,即将语音信号的分形特征参数合并到传统的Mel频率倒谱系数(MFCC)中,这样组成混合的特征参数在语音识别系统中可以提高系统的识别率。
本发明的目的之一是提出一种基于分形特征的智能轮椅语音识别控制方法方法;本发明的目的之二是提出一种基于分形特征的智能轮椅语音识别控制系统。
本发明的目的之一是通过以下技术方案来实现的:
本发明提供的基于分形特征的智能轮椅语音识别控制方法,包括以下步骤:
S1:语音信号命令词输入;
S2:对语音信号进行预处理;
S3:提取经过预处理后语音信号的特征参数;
S4:将特征参数与模板库的模板进行模式匹配;
S5:选择匹配相似度最高的模板作为识别结果;
S6:将该识别结果转换成智能轮椅的运动命令;
S7:调用相应的控制函数,驱动智能轮椅按照语音信号进行运动。
进一步,所述步骤S2中的预处理,包括语音的预加重滤波、加窗分帧处理与双门限端点检测;
进一步,所述步骤S3中的特征提取包括以下步骤:
S31:提取语音信号的MFCC(Mel频率倒谱系数)参数;
S311:首先确定每一帧语音采样序列的点数,对每帧序列s(n)进行预加重滤波处理;
S312:再进行离散FFT(傅立叶变换)变换,取模的平方得到离散功率谱S(n);
S313:在语音的频谱范围内设置若干个带通滤波器;
Hm(n),m=0,1,·,M-1,n=0,1,·,N/2-1
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110109168.2/2.html,转载请声明来源钻瓜专利网。