[发明专利]面向家居环境的智能哭声检测方法在审
申请号: | 201810208673.4 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108461091A | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 张晖;毛小旺 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L17/02;G10L17/04 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了一种面向家居环境的智能哭声检测方法,本方法首先建立样本数据库,并对样本库中的数据进行分类训练GMM模型,再以GMM模型各个分量的均值参数,作为SVM模型的训练样本,训练出混合识别GMM‑SVM模型。本方法可在智能终端本地进行哭声检测,摆脱对服务端的依赖,大大缩短了检测周期,提升用户的业务体验。此外,本方法中的模型充分考虑了同类音频数据之间的相似性和不同类数据之间的差异性,比单模型判决系统具有更佳的识别准确率,且识别速率也能极大提升,为哭声检测产品中提供了优秀的解决方案。 | ||
搜索关键词: | 哭声检测 家居环境 样本数据库 均值参数 判决系统 同类数据 训练样本 业务体验 音频数据 智能终端 智能 差异性 单模型 样本库 准确率 分类 检测 服务 | ||
【主权项】:
1.一种面向家居环境的智能哭声检测方法,其特征在于,包括如下步骤:S1,采集哭声与非哭声语音信号,分两类存入样本库;并对样本库中各类语音信号进行预处理,得到各类语音信号对应的语音帧序列;S2,对S1中所述语音帧序列中每一帧,提取24维的音频特征,得到各类语音信号对应特征向量序列;S3,以S2中所述特征向量序列,作为GMM训练样本,采用EM算法,分别训练哭声GMM模型和非哭声GMM模型;并提取训练好的GMM模型中各个高斯分量的均值参数,组成均值向量序列;S4,对S3所述均值向量序列中每一个向量,添加类别标签,并保存到均值特征样本集;并以均值特征样本集作为训练样本,训练SVM模型;S5,采集待识别的音频信号,并按照S1至S2的方法,提取信号对应的音频特征序列;其次,将音频特征序列中每一帧信号,与S3中所述均值向量序列中每一个均值向量,计算二者的似然概率,取概率最大值所对应的均值向量,作为GMM模型对该帧信号的判决结果;最后,遍历音频特征序列中所有帧,得到均值向量序列X={X1,X2,...,Xp,...,XL};其中,Xp为第p帧信号对应的均值向量,L为音频特征序列长度;S6,将S5中所述均值向量序列X={X1,X2,...,Xp,...,XL},输入SVM模型,逐帧进行判决,最后将每帧判决结果h(Xp),按照下式进行累加求均值,得到最终音频文件的识别结果R;
其中,h(Xp)为SVM模型判决函数,输出值为1或‑1;若R取值为正,则待识别音频信号判决为哭声;若R取值为负,则待识别音频信号判决为非哭声。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810208673.4/,转载请声明来源钻瓜专利网。
- 上一篇:语音信号处理装置及语音信号处理方法
- 下一篇:一种对帕金森病语音分析的方法