[发明专利]一种基于语音识别的室内智能控制系统在审
申请号: | 201710632884.6 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107369447A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 韦德远 | 申请(专利权)人: | 梧州井儿铺贸易有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京高航知识产权代理有限公司11530 | 代理人: | 赵永强 |
地址: | 543000 广西壮族自治区梧州市银*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 识别 室内 智能 控制系统 | ||
1.一种基于语音识别的室内智能控制系统,包括智能家居装置,其特征在于,至少还包括语音接收模块、语音转换模块、中央控制系统模块和指令执行模块,所述语音接收模块用于接收外部的语音输入信息;所述语音转换模块用于将所述语音接收模块传递的语音输入信息转化为文本信息;所述中央控制模块用于将所述语音转换模块传递的文本信息进行解析生成控制指令并判断传递方式;所述指令执行模块用于根据所述中央控制模块生成的控制指令向智能家居发出动作指令。
2.根据权利要求1所述的一种基于语音识别的室内智能控制系统,其特征在于,所述智能家居装置至少包括远程接收指令模块和动作执行装置,所述远程接收指令模块用于接收所述指令执行模块传递的动作指令;所述动作执行装置用于执行所述远程接收指令传递的动作。
3.根据权利要求1所述的一种基于语音识别的室内智能控制系统,其特征在于,还包括网络控制模块,所述网络控制模块用于连接网络,并通过无线网络与所述的智能家居连接,接收所述指令执行模块发出的指令程度欢送至所述智能家居的远程接收指令模块。
4.根据权利要求1所述的一种基于语音识别的室内智能控制系统,其特征在于,还包括红外发射模块,用于接收所述指令执行模块发出的动作指令,并通过红外编码发送至所述智能家居。
5.根据权利要求1所述的一种基于语音识别的室内智能控制系统,其特征在于,所述语音转换模块包括语音指令检测单元,语音指令增强单元,特征提取单元和语音指令识别单元,所述语音指令检测单元用于检测并提取出语音输入信息中有效的语音指令信息部分;所述语音指令增强单元用于对语音指令信息部分进行增强处理,获取增强后的语音指令信息部分;所述特征提取单元用于对增强后的语音指令信息部分进行指令特征参数的提取;所述音指令识别单元用于根据所述指令特征参数对进行识别,获取相应的文本信息。
6.根据权利要求5所述的一种基于语音识别的室内智能控制系统,其特征在于,所述语音指令检测单元用于检测并提取出语音输入信息中有效的语音指令信息部分,包括:
(1)使用汉明窗,对语音输入信息按帧间50%的重叠进行分帧处理,获取每一帧语音输入信息;
(2)分别获取每一帧语音输入信息的动态特征,包括:
(21)采用下列的函数获取每一帧语音输入信息的对数能量特征:
LE(i)=lg(E(i)+α)-lgα
其中,
式中,LE(i)表示语音输入信息的第i帧的对数能量特征,E(i)表示语音输入信息第i帧的短时能量,|si(n)|2表示语音输入信息的第i帧在不同时刻的能量值,N表示所述汉明窗的长度,α表示设定的对数能量因子;
(22)对每一帧语音输入信息进行短时傅里叶变换,得到能量普T(fl),其中fl表示频率分量,采用下列函数获取能量普T(fl)的归一化谱密度分布,具体为:
式中,p(l,i)表示语音输入信息第i帧频率分量为fl的概率密度,Ti(fl)表示第i帧语音输入信息的能量普中频率分量为fl的能量强度,L表示短时傅里叶变换的窗长度,与汉明窗长度相等,即L=N;
(23)采用下列函数获取每一帧语音输入信息的谱熵特征:
式中,H(i)表示语音输入信息第i帧的谱熵特征,p(l,i)表示语音输入信息第i帧频率分量为fl的概率密度;
(24)采用下列函数获取每一帧语音输入信息的动态特征:
LESE(i)=(1+|(LE(i)-AveE)(H(i)-AveH)|)β
式中,LESE(i)表示语音输入信息第i帧的动态特征,LE(i)表示语音输入信息的第i帧的对数能量特征,H(i)表示语音输入信息第i帧的谱熵特征,AveE和AveH分别表示前10帧语音输入信息的对数能量和谱熵特征的平均值,β表示设定的动态特征因子,β∈[9,10];
(3)根据语音输入信息的动态特征,将每一帧语音输入信息动态特征和设定的阈值进行比较,保留动态特征大于阈值的对应的语音输入信息帧并记为语音指令信息部分作进一步处理,其余部分记为无声部分。
7.根据权利要求6所述的一种基于语音识别的室内智能控制系统,其特征在于,所述语音指令增强单元用于对语音指令信息部分进行增强处理,获取增强后的语音指令信息部分,包括:
(1)对语音指令信息部分进行快速傅里叶变换,获取语音指令信息部分的幅度谱x(f),其中f表示频率;
(2)采用下列自定义的语音增强函数对语音指令信息部分进行语音增强处理:
式中,x′(f)表示语音增强处理后语音指令信息部分的幅度谱,x(f)表示语音指令信息部分的幅度谱,|x(f)|2表示语音指令信息部分的功率谱,μ和λ表示可调节的增益效果调整因子,表示噪声的功率谱的估计,通过获取所述语音指令信息部分之前的所述无声部分的噪声功率谱获得,可表示为:其中表示对当前帧噪声功率谱的估计,φ′(f)表示前面帧的噪声功率谱的估计,φ(f)表示当前帧获得的噪声功率谱,γ表示当前帧噪声功率谱的权重,需注意的是噪声功率谱只在所述无声部分进行更新,在所述语音指令信息部分不进行更新;
(3)对自定义滤波器的结果进行逆快速傅里叶变换,得到增强后的语音指令信息部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梧州井儿铺贸易有限公司,未经梧州井儿铺贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710632884.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便打开的双洞淋香机
- 下一篇:一种微波自动感应香薰机