[发明专利]特定声音识别方法、设备和存储介质在审
申请号: | 201780009004.8 | 申请日: | 2017-10-24 |
公开(公告)号: | CN109074822A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 刘洪涛;王伟;孟亚彬 | 申请(专利权)人: | 深圳和而泰智能控制股份有限公司 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/24;G10L25/30;G10L25/18;G10L15/06 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 王广涛 |
地址: | 518000 广东省深圳市高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征参数 矩阵 存储介质 倒谱系数 梅尔频率 声音识别 采样声音信号 产品制造成本 神经网络模型 方法和设备 算法复杂度 神经网络 声音特征 提取特征 硬件要求 预先获取 计算量 算法 | ||
一种特定声音识别方法、设备和存储介质,该方法包括:采样声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵(201);从该声音信号的梅尔频率倒谱系数特征参数矩阵中提取特征参数(202);将特征参数输入预先获取的基于深度神经网络的特定声音特征模型进行识别,以确认该声音信号是否为特定声音(203)。该方法和设备采用基于MFCC特征参数和深度神经网络模型的识别算法,算法复杂度低、计算量少,从而对硬件要求低,降低了产品制造成本。
技术领域
本申请实施例涉及声音处理技术,尤其涉及一种特定声音识别方法、设备和存储介质。
背景技术
在生活中,我们每天都可以听到一些特定的、没有实际语义的声音。如:鼾声、咳嗽声、喷嚏声等等,尽管它们没有实际的语义,但是却能够准确的反应人们的生理需求、状态或者物质的品质。例如:医生能够通过病人的鼾声、咳嗽声、喷嚏声等辨别人们的健康情况。这类特定声音内容比较简单、重复,却是我们生活中不可或缺的一部分,有效的识别和判断各种特定声音信号意义重大。
目前,有研究通过语音识别技术识别特定声音。例如有针对咳嗽声音的识别方法,将咳嗽声音的特性和语音识别技术相结合,建立咳嗽模型,采用基于动态时间规整算法(Dynamic Time Warping,DTW)的模型匹配方法对特定人的孤立咳嗽声音进行识别。
实现本申请过程中,发明人发现相关技术中至少存在如下问题:现有的特定声音识别算法,计算量大、对硬件设备要求高。
发明内容
本申请的目的在于提供一种特定声音识别方法、设备和存储介质,能对特定声音进行识别,且算法简单、计算量小,对硬件设备要求低。
为实现上述目的,第一方面,本申请实施例提供了一种特定声音识别方法,所述方法包括:
采样声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵;
从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取特征参数;
将所述特征参数输入预先获取的基于深度神经网络的特定声音特征模型进行识别,以确定所述声音信号是否为特定声音。
可选的,所述方法还包括:预先获取所述基于深度神经网络的特定声音特征模型。
可选的,所述预先获取所述基于深度神经网络的特定声音特征模型,包括:
采集预设数量的特定声音样本信号并获取所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵;
从所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中提取所述特征参数;
将所述特定声音样本信号的特征参数作为输入,训练基于深度神经网络模型,以获取所述基于深度神经网络的特定声音特征模型。
可选的,所述从所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中提取所述特征参数,包括:
将特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中各信号帧的梅尔频率倒谱系数依次首尾相连组成一特征向量;
将所述特征向量按预设步长从所述特征向量头部到所述特征向量尾部对所述特征向量进行分割,获得包括一组长度均为预设长度的子特征向量的特征参数,每个子特征向量具有相同的标签,所述预设步长为每帧梅尔频率倒谱系数长度的整数倍,所述预设长度为所述每帧梅尔频率倒谱系数长度的整数倍;
所述从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取特征参数,包括:
将声音信号的梅尔频率倒谱系数特征参数矩阵中各信号帧的梅尔频率倒谱系数依次首尾相连组成一特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳和而泰智能控制股份有限公司,未经深圳和而泰智能控制股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780009004.8/2.html,转载请声明来源钻瓜专利网。