[发明专利]面向家居环境的智能哭声检测方法在审
申请号: | 201810208673.4 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108461091A | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 张晖;毛小旺 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L17/02;G10L17/04 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哭声检测 家居环境 样本数据库 均值参数 判决系统 同类数据 训练样本 业务体验 音频数据 智能终端 智能 差异性 单模型 样本库 准确率 分类 检测 服务 | ||
本发明揭示了一种面向家居环境的智能哭声检测方法,本方法首先建立样本数据库,并对样本库中的数据进行分类训练GMM模型,再以GMM模型各个分量的均值参数,作为SVM模型的训练样本,训练出混合识别GMM‑SVM模型。本方法可在智能终端本地进行哭声检测,摆脱对服务端的依赖,大大缩短了检测周期,提升用户的业务体验。此外,本方法中的模型充分考虑了同类音频数据之间的相似性和不同类数据之间的差异性,比单模型判决系统具有更佳的识别准确率,且识别速率也能极大提升,为哭声检测产品中提供了优秀的解决方案。
技术领域
本发明涉及一种检测方法,具体涉及一种面向家居环境的智能哭声检测方法,属于智能家居领域。
背景技术
近年来,随着人工智能、机器学习领域的快速发展,越来越多的业务、产品被贴上智能化标签。这些新业务相对传统业务,满足了人们因物质生活水平的提高,而日益增长的个性化、定制化的业务需求。
具体而言,婴幼儿是家庭的重要成员,需要得到家长的额外照顾。又由于其身心仍处于发育阶段、尚未成熟,因此对于新生婴儿来说,妥善的照顾是不可或缺的。一般而言,新生婴儿仅能藉由哭泣的方式表达情绪与需求,而在不同的情绪或需求下其所发出的哭声也有所不同。因此,婴儿的父母或照护人可以依据新生婴儿的哭声来概略判断婴儿的需求与情绪,进而采取不同的行动。
正是由于上述两方面的原因,针对年轻父母因工作或家务繁忙,容易对新生婴儿疏于看护的社会现象,目前市面上出现了多种智能哭声检测技术,也有厂商研发了相关的婴儿哭声检测产品,如小米公司的小蚁摄像头、360公司的水滴摄像机等,但此类产品大都采用的是“本地+云端”检测架构,检测周期长,对网络质量要求高;而智能终端本地只进行一些简单功能实现,过度依赖于服务端。此类产品虽然都贴上智能化的标签,但更确切的说,应该是“伪智能”。
综上所述,如何克服上述现有技术上的不足,提出一种面向家居环境的智能哭声检测方法,进而使产品摆脱对云端的依赖,缩短检测周期,提升用户的业务体验,就成为了本领域内的技术人员亟待解决的问题。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种面向家居环境的智能哭声检测方法。
本发明的目的,将通过以下技术方案得以实现:
一种面向家居环境的智能哭声检测方法,包括如下步骤,
S1,采集哭声与非哭声语音信号,分两类存入样本库;并对样本库中各类语音信号进行预处理,得到各类语音信号对应的语音帧序列;
S2,对S1中所述语音帧序列中每一帧,提取24维的音频特征,得到各类语音信号对应特征向量序列;
S3,以S2中所述特征向量序列,作为GMM训练样本,采用EM算法,分别训练哭声GMM模型和非哭声GMM模型;并提取训练好的GMM模型中各个高斯分量的均值参数,组成均值向量序列;
S4,对S3所述均值向量序列中每一个向量,添加类别标签,并保存到均值特征样本集;并以均值特征样本集作为训练样本,训练SVM模型;
S5,采集待识别的音频信号,并按照S1至S2的方法,提取信号对应的音频特征序列;其次,将音频特征序列中每一帧信号,与S3中所述均值向量序列中每一个均值向量,计算二者的似然概率,取概率最大值所对应的均值向量,作为GMM模型对该帧信号的判决结果;最后,遍历音频特征序列中所有帧,得到均值向量序列X={X1,X2,...,Xp,...,XL};其中,Xp为第p帧信号对应的均值向量,L为音频特征序列长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810208673.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音信号处理装置及语音信号处理方法
- 下一篇:一种对帕金森病语音分析的方法