[发明专利]一种婴儿哭声识别方法、装置及设备在审
申请号: | 201910029052.4 | 申请日: | 2019-01-12 |
公开(公告)号: | CN109658953A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 乔宇;王群 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/21;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频特征向量 婴儿哭声 语音数据段 采集语音数据 装置及设备 监护终端 结果发送 模型识别 截取 时长 | ||
一种婴儿哭声识别方法包括:采集语音数据,截取预定时长的语音数据段;计算所述语音数据段中包括的两个或者两个以上的音频特征向量;根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端。由于识别结果是根据两个或两个以上的音频特征向量所识别,因而识别结果更加准确可靠,有利于提高婴儿哭声识别的精度。
技术领域
本申请属于声音识别领域,尤其涉及一种婴儿哭声识别方法、装置及设备。
背景技术
新生婴儿在表达情感需求或生理需求时,一般通过婴儿的哭声传递给外部世界。在现实生活中,由于照顾新生婴儿的工作基本托付给家里的老人或婴儿的母亲等监护人,并且监护人往往会同时身兼多职。因而,当婴儿处于睡眠状态的时候,监护人可能会忙于其它事情而处于离开状态。由于空间距离的原因,婴儿的啼哭并不一定能被监护人直接听到,使得监护人不能及时的听到婴儿的需求。
为了使得监护人能够及时的听到婴儿的需求,目前已经出现一些婴儿哭声的提醒装置,基于摄像头或穿戴式设备等数据采集设备,将数据采集设备接入网络,通过云端来完成识别工作。目前常见的识别方案是基于分贝、过零率或能量这些单一指标来确定是否需要报警,当环境中出现干扰音时,容易使得误报率较高。
发明内容
有鉴于此,本申请实施例提供了一种婴儿哭声识别方法、装置及设备,以解决现有技术中识别婴儿哭声的方法中,当环境出现干扰时,容易使得误报率高的问题。
本申请实施例的第一方面提供了一种婴儿哭声识别方法,所述婴儿哭声识别方法包括:
采集语音数据,截取预定时长的语音数据段;
计算所述语音数据段中包括的两个或者两个以上的音频特征向量;
根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端。
结合第一方面,在第一方面的第一种可能实现方式中,所述计算所述语音数据段中包括的两个或者两个以上的音频特征向量的步骤包括:
计算所述语音数据段中的过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者多种;
选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量。
结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量的步骤包括:
选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列,计算所选择的特征序列的均值;
根据所计算的均值确定所述音频特征向量。
结合第一方面,在第一方面的第三种可能实现方式中,所述根据预先设定的识别模型识别所述音频特征向量,将所述识别结果发送至监护终端的步骤包括:
判断当前网络是否处于连接状态;
如果当前网络处于连接状态,则将所述音频特征向量发送至云服务器,以使得云服务器根据识别结果向所述监护终端发送应用提醒消息。
结合第一方面的第三种可能实现方式,在第一方面的第四种可能实现方式中,所述方法还包括:
如果当前网络处于断开状态,则通过本地存储的神经网络模型识别所述音频特征向量;
当识别结果为预定的告警结果时,向监护终端发送短信息或者拨打告警电话。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910029052.4/2.html,转载请声明来源钻瓜专利网。