[发明专利]一种通过语音控制跑步机的装置有效
申请号: | 201710633596.2 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107393533B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 韦德永 | 申请(专利权)人: | 侨伟运动器材(南京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 11530 北京华识知识产权代理有限公司 | 代理人: | 赵永强 |
地址: | 211299 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 语音 控制 跑步 装置 | ||
1.一种通过语音控制跑步机的装置,其特征在于,所述装置包括:
声音接收单元,用于通过麦克风接收用户发出的声音;
文字识别单元,用于将所述声音接收单元接收的声音转换为文字;
指令转换单元,用于将所述文字识别单元识别的文字转换为指令;
指令执行单元,用于跑步机对应的设备接收并执行所述指令转换单元转换的指令;
其中,所述文字识别单元,包括:
检测子单元,用于检测并提取接收的声音中的声音信息部分;
增强子单元,用于对声音信息部分进行增强处理,获取增强后的声音信息部分;
特征子单元,用于对增强后的声音信息部分进行特征提取,获取声音信息的特征参数;
识别子单元,用于根据所述声音信息的特征参数,获取相应的文字信息;
其中,所述增强子单元,对由检测子单元提取得到的声音信息部分进行增强处理,获取增强后的声音信息部分,具体为:
对声音信息部分进行快速傅里叶变换,获取声音信息部分的幅度谱f(r),其中r表示频率;
对声音信息部分进行语音增强处理,采用的自定义的语音增强函数为:
式中,fz(r)表示语音增强处理后声音信息部分的幅度谱,f(r)表示声音信息部分的幅度谱,|f(r)|2表示声音信息部分的功率谱,ω1和ω2表示可调节的增益效果调整因子,表示噪声的功率谱的估计,通过获取所述声音信息部分之前的无声部分的噪声功率谱获得,可表示为:其中表示对当前帧噪声功率谱的估计,表示前面帧的噪声功率谱的估计,Zn(r)表示当前帧获得的噪声功率谱,表示当前帧噪声功率谱的权重,其中,噪声功率谱只在所述无声部分进行更新,在所述声音信息部分不进行更新;
对自定义滤波器的结果进行逆快速傅里叶变换,得到增强后的声音信息部分。
2.根据权利要求1所述的一种通过语音控制跑步机的装置,其特征在于,所述装置还包括:
降噪单元,用于对接收的声音进行降噪处理。
3.根据权利要求2所述的一种通过语音控制跑步机的装置,其特征在于,所述指令转换单元,包括:
对比子单元,用于将所述文字与预设的文字-指令数据库进行比对;
转换子单元,用于根据所述对比子单元的对比结果将文字转换为命令。
4.根据权利要求3所述的一种通过语音控制跑步机的装置,其特征在于,所述接收包括:通过蓝牙接收、通过串口接收、通过Zigbee接收、通过电子通信线路接收。
5.据权利要求1所述的一种通过语音控制跑步机的装置,其特征在于,所述特征子单元,对增强后的声音信息部分进行特征提取,获取声音信息的特征参数,具体为:
对增强后的声音信息部分进行分帧、加窗处理;
增强后的声音信息部分每一帧进行特征参数提取,具体为:
(1)依次选取声音信息部分中的每一帧进行快速傅里叶变换,获取频谱Fp(r);
(2)将频谱Fp(r)转化为梅尔频率谱Fp(r‘);
(3)采用下列自定义滤波器组获取语音指令信号的特征能量谱NL(i),具体为:
式中,NL(i)表示滤波器组中第i个滤波器输出对应的特征能量谱NL(i),i=1,2,…,I,I表示滤波器组中滤波器的个数,Fp(r‘)表示转化到梅尔频率后得到的频谱,r‘表示梅尔频率,表示滤波器组中第i个滤波器的质心参数,其中表示中间量,HSi、HHi、HXi分别表示滤波器组中第i个滤波器的上限、中心、下限,其中HHi=HSi-1=HXi+1,
(4)对获取的特征能量谱NL(i)取对数,然后进行DCT离散余弦变换,获取DCT后的前I个系数作为本帧声音信息部分的I维语音特征参数;
重复步骤(1)至(4)直到获取增强后的声音信息部分每一帧的特征参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于侨伟运动器材(南京)有限公司,未经侨伟运动器材(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710633596.2/1.html,转载请声明来源钻瓜专利网。