[发明专利]车载语音识别电子娱乐控制系统在审
申请号: | 201710632907.3 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107437418A | 公开(公告)日: | 2017-12-05 |
发明(设计)人: | 韦玥 | 申请(专利权)人: | 深圳市益鑫智能科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;B60R16/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南山区西*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载 语音 识别 电子 娱乐 控制系统 | ||
1.一种车载语音识别电子娱乐控制系统,其特征在于,包括自然语音输入模块,语音处理模块,蓝牙模块,媒体播放器,空调器,应用控制程序和车身控制模块,所述自然语音输入模块用于接收人员的语音信号;所述语音处理模块用于接收所述自然语音输入模块的语音信号,并将语音信号转换成可执行的控制命令;所述蓝牙模块用于接收可执行命令,对蓝牙设备进行控制;所述媒体播放器用于接收可执行的控制命令,控制所述媒体播放器播放媒体;空调器,所述空调器用于接收可执行的控制命令,调节温度和风量、气流车内外循环模式和吹风模式。
2.根据权利要求1所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述车载语音识别电子娱乐控制系统还包括导航仪,所述导航仪用于接收可执行的控制命令,设定目的地、规划导航路径、选择路径和更改目的地。
3.根据权利要求1所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述应用控制程序用于接收可执行的控制命令,运行相应的应用程序。
4.根据权利要求1所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述车身控制模块用于接收可执行的控制命令,控制车内的设施。
5.根据权利要求1所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述车在语音识别电子娱乐控制系统还包括题型模块,所述提醒模块用于接收可执行的控制命令,向车内的人员发出语音的提示。
6.根据权利要求1所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述语音处理模块包括自然语音检测单元,自然语音增强单元,特征提取单元和自然语音识别单元,所述自然语音检测单元用于检测并提取接收的语音信号中有效的自然语音信息部分;所述自然语音增强单元用于对自然语音信息部分进行增强处理,获取待识别自然语音信息部分;所述特征提取单元用于对待识别自然语音信息部分进行指令特征参数的提取;所述音指令识别单元用于根据所述指令特征参数对进行识别,获取相应的控制命令。
7.根据权利要求6所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述自然语音检测单元用于检测并提取接收的语音信号中有效的自然语音信息,包括:
(1)对接收的语音信号按帧间50%的重叠进行分帧处理,并加汉明窗,获取每一帧语音信号;
(2)获取每一帧语音信号的对数能量特征,采用的函数为:
式中,D(m)表示语音信号的第m帧的对数能量特征,表示语音信号第m帧的短时能量,|rm(n)|2表示语音信号的第m帧在不同时刻的能量值,U表示所述汉明窗的长度,c表示设定的对数能量因子;
(3)对每一帧语音信号进行短时傅里叶变换,得到能量普K(fn),其中fn表示频率分量;
(4)获取每一帧语音信号的谱熵特征,采用的函数为:
其中,
式中,T(m)表示语音信号第m帧的谱熵特征,pg(n,m)表示语音信号第m帧频率分量为fn的概率密度,Km(fn)表示第m帧语音信号的能量普中频率分量为fn的能量强度,N表示短时傅里叶变换的窗长度,与汉明窗长度相等,即N=U;
(5)获取每一帧语音信号的动态特征,采用的自定义函数为:
式中,DT(m)表示语音信号第m帧的动态特征,D(m)表示语音信号的第m帧的对数能量特征,T(m)表示语音信号第m帧的谱熵特征,ΛD和ΛT分别表示前10帧语音信号的对数能量和谱熵特征的平均值,β表示设定的动态特征因子,ω∈[1,2];
(6)根据语音信号的动态特征,将每一帧语音信号动态特征和设定的阈值进行比较,保留动态特征大于阈值的对应的语音信号帧并记为自然语音信息部分作进一步处理,其余部分记为无声部分。
8.据权利要求6所述的一种车载语音识别电子娱乐控制系统,其特征在于,所述特征提取单元用于对由所述自然语音增强单元获取的待识别自然语音信息部分进行指令特征参数的提取,包括:
(1)对待识别自然语音信息部分进行分帧、加汉明窗处理;
(2)依次选取自然语音信息部分中的一帧进行快速傅里叶变换,获取频谱R(f);
(3)将频谱R(f)转化为梅尔频率R(f‘),并采用下列自定义滤波器组获取自然语音信号的特征能量谱Eb(x),具体为:
其中,
式中,Eb(x)表示滤波器组中第x个滤波器输出对应的特征能量谱Eb(x),x=1,2,…,X,X表示滤波器组中滤波器的个数,R(f‘)表示转化到梅尔频率后得到的频谱,f‘表示梅尔频率,表示滤波器组中第x个滤波器的质心参数,Vx(f)表示滤波器组中第x个滤波器,jx、hx、kx分别表示滤波器组中第x个滤波器的上限、中心、下限,其中hx=jx-1=kx+1,
(4)对获取的特征能量谱E(x)取对数,然后进行离散余弦变换,获取离散余弦变换后的前X个系数作为本帧自然语音信息部分的X维语音特征参数;
(5)重复步骤(2)至(4)直到获取待识别自然语音信息部分每一帧的特征参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市益鑫智能科技有限公司,未经深圳市益鑫智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710632907.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于测量在张紧带中的拉应力的装置和方法
- 下一篇:致动装置