[发明专利]一种选频电路触发多级多词语音唤醒控制灯具的方法在审
申请号: | 201710696124.1 | 申请日: | 2017-08-03 |
公开(公告)号: | CN107969055A | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 姜华;徐佳;袁亭;林若瑜;刘超 | 申请(专利权)人: | 南京邮电大学盐城大数据研究院有限公司 |
主分类号: | H05B37/02 | 分类号: | H05B37/02;G10L15/22;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224005 江苏省盐城市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电路 触发 多级 词语 唤醒 控制 灯具 方法 | ||
技术领域
本发明涉及语音识别控制、灯具控制技术领域,提供一种选频电路触发多级多词语音唤醒控制灯具的方法。
背景技术
语音识别目前在国内和国际上均表现出寡头垄断的格局。国际市场上Nuance市场份额遥遥领先,占据了62%的市场份额。在国内市场方面,科大讯飞优势明显,占据了54%的市场份额排名第一。
目前国内外语音识别技术虽然取得了很大的进展但是应用还有很多局限性,语音识别一般分为基于云端的非特定人声大规模连续语音识别、不联网的语音唤醒、可以不联网的命令词识别。
(1)云端的非特定人声大规模连续语音识别,识别精度高,可以增加语义理解、NLP、TTS功能,但是要求设备必须联网,响应时间慢、成本高、用户体验差。
(2)语音唤醒,就是一直实时检测唤醒词,用户体验好,但是当多个唤醒词时,误唤醒的概率会增大,同时唤醒词在不同的MCU上需要特别的定制,不能通用。
(3)命令词识别,就是通过某种触发如按键、语音唤醒使其工作,录3-5秒的音然后识别,这种方式比较成熟,但是运行时占用的CPU和RAM会显著增大,同时命令词在不同的MCU上需要特别的定制,不能通用。
(4)现有的不联网的语音识别模块,基本都是采用的ARM11及以上的cpu运行,体积大,成本高,功耗大,识别率低,同时由于ARM11以上芯片都必须带操作系统如linux,系统的稳定性比普通MCU差很多,不适合用在灯具上。
(5)现有的不联网的语音识别模块,由于都需要做傅里叶运算,功耗很大,而没有人时,一直在做识别,即不节能,也没有必要。
本发明可以在普通灯具的基础上,提供一种选频电路触发多级多词语音唤醒控制灯具的方法,系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个普通麦克风传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。本发明主要通过11个步骤实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手。
发明内容
本本发明的目的是提供一种选频电路触发多级多词语音唤醒控制灯具的方法,成本低、使用简单、识别率高、使用场景覆盖广,方便用户在家远距离语音控制灯具开关、调光、调色。实现只要说二句话,一个一级唤醒词,一个二级唤醒词就能实现灯具开关、调光、调色的功能,从而有效的培养用户习惯,让用户真正的解放双手,方便人们生活。
本发明的目的是这样实现的:系统硬件由通用MCU,一个独立16位的ADC芯片,一个高灵敏、高信噪比麦克风,一个普通麦克风传感器及其信号处理电路,一个拨码开关及外围电路组成,软件为多级多词语音唤醒引擎。
系统分如下两个方面:
(1)硬件部分:
如图3所示,R7为普通麦克风提供工作所需要的偏置电流,信号经C1,这样只有交流分量藕合过来,采集到的信号会通过一个带通的放大器U1A,带通放大器的上限频率1.2khz,下限频率为100hz,,增益为10倍,这样放大器就会仅仅放大人说话的声音而对其他声音不敏感,放大过的信号送给比较器U1B,当信号赋值超过比较器的上限系统就会输出高电平信号,触发多级多词语音唤醒引擎。
(2)软件部分:
步骤1:预先训练、存储多个不同唤醒词的特征值模型到系统中硬件部分的通用MCU中;
步骤2:系统根据拨码开关,选择灯具的类型:卧室灯、厨房灯、客厅灯、厕所灯、书房灯、小夜灯、台灯、小灯中的一个,并确定一个一级唤醒词;
步骤3:系统中高灵敏、高信噪比麦克风实时采集语音并输入独立16位的ADC芯片;
步骤4:独立16位的ADC芯片通过I2S或SPI接口把语音实时送入通用MCU;
步骤5:通用MCU实时运行预处理算法,进行回声消除、降噪;
步骤6:通用MCU实时计算预处理后的语音声学特征参数MFCC及计算似然概率打分;
步骤7:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值都不匹配,则继续进行步骤2。
步骤8:如果通用MCU实时计算的语音声学特征参数MFCC与拨码开关确定的一级唤醒词的特征值模型的特征值匹配,则停止语音唤醒流程,并开始录音。
步骤9:录音一段时间后(2-5秒可以设置),停止录音,通用MCU计算的录音的语音声学特征参数MFCC与预先存储的通用二级唤醒词识别模型不匹配,则继续进行步骤2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学盐城大数据研究院有限公司,未经南京邮电大学盐城大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710696124.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在二维及三维空间上的虚拟声像定位方法
- 下一篇:散热器