[发明专利]语音唤醒方法在审
申请号: | 201910395636.3 | 申请日: | 2019-05-13 |
公开(公告)号: | CN110047471A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 唐远兵 | 申请(专利权)人: | 深圳市智宇盟科技有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/22;G10L19/16 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 赵娜 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 缓存 服务器识别 唤醒指令 音频数据 唤醒 开始点 指令 检测 服务器 语音端点检测 服务器语音 步骤编码 步骤确定 采样数据 方便功能 设备发送 设备唤醒 占用资源 采样 上传 录音 采集 保留 成功 | ||
1.一种语音唤醒方法,其特征在于,具体包括以下步骤:
A.开启录音:获取采样pcm音频数据;
B.缓存PCM数据:将采集的pcm音频数据缓存在buffer里;
C.语音端点检测:通过计算一定时间内采样数据的能量值,判断语音的开始点;
D.AMR编码:通过C步骤确定语音的开始点后,将保留当前的缓存PCM音频数据,并对pcm音频数据做AMR编码,直到确定语音结束;
E.上传AMR数据:将D步骤编码后的AMR音频数据上传到服务器;
F.服务器语音识别:服务器识别AMR音频数据,检测是否为预先设定的指令;
G.服务器下发指令:如果F步骤中服务器识别成功并检测为预先设定的指令,向设备发送唤醒指令。
H.设备唤醒:设备收到唤醒指令后唤醒。
2.根据权利要求1所述的语音唤醒方法,其特征在于,步骤B.缓存PCM数据:将采集的pcm音频数据缓存在buffer里具体指的是
步骤B.缓存PCM数据:申请系统内存,初始化为ringBuffer,用于缓存PCM数据,将采集的pcm音频数据缓存在ringBuffer。
3.根据权利要求2所述的语音唤醒方法,其特征在于,步骤C.语音端点检测:通过计算一定时间内采样数据的能量值,判断语音的开始点和结束点具体包括以下步骤:
C1.检测ringBuffer中存入的PCM音频数据的长度是否达到最小能量的检测长度,如果达到则开始检测,如果没达到则继续缓存;
C2.根据当前录音的采样率,计算固定时间内PCM音频数据的长度,将这个固定时间的所有采样点的绝对值算出一个平均值,得到上述固定时间的能量值;
C3.将步骤C2得到的能量值与设定阈值比较,若大于设定阈值,则判断为语音的开始点,执行步骤D。
4.根据权利要求3所述的语音唤醒方法,其特征在于,步骤D中确定语音结束具体包含以下步骤:
根据当前录音的采样率,计算固定时间内PCM音频数据的长度,将这个固定时间的所有采样点的绝对值算出一个平均值,得到上述固定时间的能量值;
判断得到的能量值是否小于设定阈值,若是,判断当前pcm音频数据是否为AMR编码状态,若是,则确定为语音的结束点,停止AMR编码,若不是AMR编码状态,执行步骤A。
5.根据权利要求4所述的语音唤醒方法,其特征在于,步骤D对pcm音频数据做AMR编码具体包括
对pcm音频数据分段做AMR编码,每段pcm音频数据编码完成后,清楚ringBuffer中与该段pcm音频数据长度相对应的数据。
6.根据权利要求4或5所述的语音唤醒方法,其特征在于,步骤D中,语音结束后,释放ringBuffer。
7.根据权利要求1-5任一项所述的语音唤醒方法,其特征在于,步骤A.开启录音:获取采样pcm音频数据具体包括
A.开启录音:开启设备的codec芯片,获取采样pcm音频数据。
8.根据权利要求7所述的语音唤醒方法,其特征在于,所述设备为嵌入式设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智宇盟科技有限公司,未经深圳市智宇盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910395636.3/1.html,转载请声明来源钻瓜专利网。