[发明专利]一种婴儿哭声识别方法、装置及设备在审
申请号: | 201910029052.4 | 申请日: | 2019-01-12 |
公开(公告)号: | CN109658953A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 乔宇;王群 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/21;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频特征向量 婴儿哭声 语音数据段 采集语音数据 装置及设备 监护终端 结果发送 模型识别 截取 时长 | ||
1.一种婴儿哭声识别方法,其特征在于,所述婴儿哭声识别方法包括:
采集语音数据,截取预定时长的语音数据段;
计算所述语音数据段中包括的两个或者两个以上的音频特征向量;
根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端。
2.根据权利要求1所述的婴儿哭声识别方法,其特征在于,所述计算所述语音数据段中包括的两个或者两个以上的音频特征向量的步骤包括:
计算所述语音数据段中的过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者多种;
选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量。
3.根据权利要求2所述的婴儿哭声识别方法,其特征在于,所述选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量的步骤包括:
选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列,计算所选择的特征序列的均值;
根据所计算的均值确定所述音频特征向量。
4.根据权利要求1所述的婴儿哭声识别方法,其特征在于,所述根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端的步骤包括:
判断当前网络是否处于连接状态;
如果当前网络处于连接状态,则将所述音频特征向量发送至云服务器,以使得云服务器根据识别结果向所述监护终端发送应用提醒消息。
5.根据权利要求4所述的婴儿哭声识别方法,其特征在于,所述方法还包括:
如果当前网络处于断开状态,则通过本地存储的神经网络模型识别所述音频特征向量;
当识别结果为预定的告警结果时,向监护终端发送短信息或者拨打告警电话。
6.根据权利要求1所述的婴儿哭声识别方法,其特征在于,在所述计算所述语音数据段中包括的两个或者两个以上的音频特征向量的步骤之前,所述方法还包括:
对所述语音数据段进行加重、分帧和加窗处理中的一项或者多项。
7.一种婴儿哭声识别装置,其特征在于,所述婴儿哭声识别装置包括:
语音数据采集单元,用于采集语音数据,截取预定时长的语音数据段;
音频特征向量计算单元,用于计算所述语音数据段中包括的两个或者两个以上的音频特征向量;
识别单元,用于根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端。
8.根据权利要求7所述的婴儿哭声识别装置,其特征在于,所述音频特征向量计算单元包括:
特征序列计算子单元,用于计算所述语音数据段中的过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者多种;
选择子单元,用于选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量。
9.一种婴儿哭声识别设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述婴儿哭声识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述婴儿哭声识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910029052.4/1.html,转载请声明来源钻瓜专利网。