[发明专利]声音的处理方法和装置有效
申请号: | 201911260445.2 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111128202B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 聂镭;王竹欣;聂颖 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/00;G10L17/02;G10L17/04;G10L25/24;A61F5/56;A61M21/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 方法 装置 | ||
1.一种声音的处理方法,其特征在于,包括:
采集目标对象发出的音频数据;
使用音频识别模型识别所述音频数据中的音频特征,提取属于鼾声的声音;
基于所述鼾声的声音,确定所述目标对象的属性,所述属性包括:所述目标对象的年龄范围;
基于所述目标对象的属性,确定对应的止鼾命令,其中,如果所述目标对象的年龄范围为未成年人的年龄范围,所述止鼾命令为播放止鼾音乐,所述止鼾音乐按照预设音量设置逐步变大,且在达到预定音量的情况下保持不变,其中,如果检测到鼾声停止,停止播放所述止鼾音乐。
2.根据权利要求1所述的方法,其特征在于,使用音频识别模型识别所述音频数据中的音频特征,提取属于鼾声的声音包括:
利用声音的能量和过零率对所述鼾声的声音进行初步检测,得到初步检测结果;
使用深度检测模型对所述初步检测结果进行深度检测,识别出所述初步检测结果中属于所述鼾声的声音。
3.根据权利要求2所述的方法,其特征在于,在使用深度检测模型对所述初步检测结果进行深度检测,识别出所述初步检测结果中属于所述鼾声的声音之前,所述方法还包括:
采集预定数量的年龄落在目标年龄范围内的多个对象的哭声音频和鼾声音频;
利用MFCC特征提取模型提取所述多个对象的哭声音频的MFCC声学特征,得到提取结果;
利用GMM算法处理所述提取结果,建立所述深度检测模型。
4.根据权利要求1所述的方法,其特征在于,基于所述目标对象的属性,确定对应的止鼾命令包括:
如果所述目标对象的年龄范围为未成年人的年龄范围,所述止鼾命令为启动睡眠唤醒装置,唤醒佩戴所述睡眠唤醒装置的对象,其中,如果检测到鼾声停止,所述睡眠唤醒装置停止工作。
5.根据权利要求1所述的方法,其特征在于,基于所述目标对象的属性,确定对应的止鼾命令包括:
如果所述目标对象的年龄范围为成年人的年龄范围,所述止鼾命令为按照预设的播放频率随机播放内置的止鼾音乐,所述止鼾音乐按照预设音量设置逐步变大,且在达到预定音量的情况下保持不变,其中,如果检测到鼾声停止,停止播放所述止鼾音乐。
6.根据权利要求1所述的方法,其特征在于,基于所述目标对象的属性,确定对应的止鼾命令包括:
如果所述目标对象的年龄范围为成年人的年龄范围,所述止鼾命令为触发至少一种类型的止鼾设备工作,且按照鼾声的持续时长,控制所述止鼾设备的工作强度和时长,其中,所述止鼾设备包括如下至少之一:止鼾枕、止鼾手环。
7.一种声音的处理方法,其特征在于,包括:
在交互界面上显示当前采集到目标对象发出的音频数据;
在所述交互界面上播放所述音频数据中属于鼾声的声音,其中,使用音频识别模型识别所述音频数据中的音频特征,并提取到所述鼾声的声音;
在所述交互界面上显示所述目标对象所属的年龄范围,其中,基于所述鼾声的声音,确定所述目标对象所属的年龄范围;
基于所述目标对象所属的年龄范围,确定对应的止鼾命令,其中,如果所述目标对象的年龄范围为未成年人的年龄范围,所述止鼾命令为播放止鼾音乐,所述止鼾音乐按照预设音量设置逐步变大,且在达到预定音量的情况下保持不变,其中,如果检测到鼾声停止,停止播放所述止鼾音乐。
8.一种声音的处理装置,其特征在于,包括:
第一采集单元,用于采集目标对象发出的音频数据;
识别单元,用于使用音频识别模型识别所述音频数据中的音频特征,提取属于鼾声的声音;
第一确定单元,用于基于所述鼾声的声音,确定所述目标对象的属性,所述属性包括:所述目标对象的年龄范围;
第二确定单元,用于基于所述目标对象的属性,确定对应的止鼾命令,其中,如果所述目标对象的年龄范围为未成年人的年龄范围,所述止鼾命令为播放止鼾音乐,所述止鼾音乐按照预设音量设置逐步变大,且在达到预定音量的情况下保持不变,其中,如果检测到鼾声停止,停止播放所述止鼾音乐。
9.一种声音的处理装置,其特征在于,包括:
第一显示单元,用于在交互界面上显示当前采集到目标对象发出的音频数据;
播放单元,用于在所述交互界面上播放所述音频数据中属于鼾声的声音,其中,使用音频识别模型识别所述音频数据中的音频特征,并提取到所述鼾声的声音;
第二显示单元,用于在所述交互界面上显示所述目标对象所属的年龄范围,其中,基于所述鼾声的声音,确定所述目标对象所属的年龄范围;
第三确定单元,用于基于所述目标对象所属的年龄范围,确定对应的止鼾命令,其中,如果所述目标对象的年龄范围为未成年人的年龄范围,所述止鼾命令为播放止鼾音乐,所述止鼾音乐按照预设音量设置逐步变大,且在达到预定音量的情况下保持不变,其中,如果检测到鼾声停止,停止播放所述止鼾音乐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911260445.2/1.html,转载请声明来源钻瓜专利网。