[发明专利]一种婴儿哭声识别方法、装置及设备在审

申请号：	201910029052.4	申请日：	2019-01-12
公开（公告）号：	CN109658953A	公开（公告）日：	2019-04-19
发明（设计）人：	乔宇;王群	申请（专利权）人：	深圳先进技术研究院
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/18;G10L25/21;G10L25/24;G10L25/30;G10L25/51
代理公司：	深圳中一专利商标事务所 44237	代理人：	高星
地址：	518055 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频特征向量婴儿哭声语音数据段采集语音数据装置及设备监护终端结果发送模型识别截取时长
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种婴儿哭声识别方法包括：采集语音数据，截取预定时长的语音数据段；计算所述语音数据段中包括的两个或者两个以上的音频特征向量；根据预先设定的识别模型识别所述音频特征向量，将所述识别结果发送至监护终端。由于识别结果是根据两个或两个以上的音频特征向量所识别，因而识别结果更加准确可靠，有利于提高婴儿哭声识别的精度。

技术领域

本申请属于声音识别领域，尤其涉及一种婴儿哭声识别方法、装置及设备。

背景技术

新生婴儿在表达情感需求或生理需求时，一般通过婴儿的哭声传递给外部世界。在现实生活中，由于照顾新生婴儿的工作基本托付给家里的老人或婴儿的母亲等监护人，并且监护人往往会同时身兼多职。因而，当婴儿处于睡眠状态的时候，监护人可能会忙于其它事情而处于离开状态。由于空间距离的原因，婴儿的啼哭并不一定能被监护人直接听到，使得监护人不能及时的听到婴儿的需求。

为了使得监护人能够及时的听到婴儿的需求，目前已经出现一些婴儿哭声的提醒装置，基于摄像头或穿戴式设备等数据采集设备，将数据采集设备接入网络，通过云端来完成识别工作。目前常见的识别方案是基于分贝、过零率或能量这些单一指标来确定是否需要报警，当环境中出现干扰音时，容易使得误报率较高。

发明内容

有鉴于此，本申请实施例提供了一种婴儿哭声识别方法、装置及设备，以解决现有技术中识别婴儿哭声的方法中，当环境出现干扰时，容易使得误报率高的问题。

本申请实施例的第一方面提供了一种婴儿哭声识别方法，所述婴儿哭声识别方法包括：

采集语音数据，截取预定时长的语音数据段；

计算所述语音数据段中包括的两个或者两个以上的音频特征向量；

根据预先设定的识别模型识别所述音频特征向量，将所述识别结果发送至监护终端。

结合第一方面，在第一方面的第一种可能实现方式中，所述计算所述语音数据段中包括的两个或者两个以上的音频特征向量的步骤包括：

计算所述语音数据段中的过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者多种；

选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量。

结合第一方面的第一种可能实现方式，在第一方面的第二种可能实现方式中，所述选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列生成音频特征向量的步骤包括：

选择过零率特征序列、能量特征序列、多阶梅尔频率倒谱系数特征序列或频谱质心特征序列中的两种或者两种以上的特征序列，计算所选择的特征序列的均值；