[发明专利]一种咳嗽自动识别方法及装置无效
申请号: | 201010217590.5 | 申请日: | 2010-07-02 |
公开(公告)号: | CN101894551A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 田联房;郑则广;莫鸿强;陈荣昌;钟南山 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L21/02;G11C7/10;A61B5/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄磊;李卫东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 咳嗽 自动识别 方法 装置 | ||
技术领域
本发明属于声音处理技术领域,特别涉及一种咳嗽自动识别方法及装置。
背景技术
慢性咳嗽是原因未明的、咳嗽为惟一症状或主要症状、时间超过8周、胸部X线检查无明显异常者。嗜酸细胞性支气管炎是慢性咳嗽的首位原因(22%),其他常见病因包括:鼻后滴漏综合征(17%)、咳嗽变异型哮喘(14%)、胃食管反流性咳嗽(12%)等)。要明确慢性咳嗽的诊断,需要有肺功能仪、诱导痰细胞分类检查和食道pH值监测等技术,目前大多数医院不具备这些条件,慢性咳嗽患者得不到及时的诊治;同时,咳嗽发作的特点(包括频率和强度的动态变化)和诱因跟天气、环境、饮食和睡眠状态等有很大的关系,若能找出咳嗽发作与天气、环境、饮食和睡眠状态的关系,可有助于了解慢性咳嗽的病因;但是,大多数患者不能准确、客观地描述咳嗽发作的特点,而现有的技术中,也没有相关技术或设备能够获取准确、客观地描述咳嗽发作的特点,因此常常会导致因就诊医生对咳嗽发作病因得不到有效的信息而影响对病人的及时诊治。
发明内容
本发明的首要目的在于克服上述现有技术的缺点与不足,提供一种可通过声音进行病人咳嗽信号处理,并能准确地获取咳嗽信号,且能对咳嗽信号进行统计的咳嗽自动识别方法
本发明的另一目的还在于提供实现上述方法的咳嗽自动识别装置。
为达上述目的,本发明采用如下的技术方案:
一种咳嗽自动识别方法,具体包括如下步骤:
(1)声音输入装置测量声压变化,并通过编码器将测量结果转为PCM格式的语音信号,存入SD卡;
(2)端点检测单元对所述步骤(1)中的PCM格式的语音信号进行端点检测,剔除非咳嗽信号,其余信号作为候选咳嗽信号;
(3)特征提取单元对候选咳嗽信号按帧提取特征,将其转换为特征向量序列;所述特征向量序列优选为一39维的倒频谱向量序列;
具体地说,特征提取单元将所述步骤(2)分帧后的候选咳嗽信号经过一组26通道的Mel频率滤波器对进行处理,得到一个12维的MFCC参数(Mel频率倒谱系数),再加上短时能量作为附加参数,构成13维向量;同时,为描述信号帧之间的相关性和咳嗽的动态特征,引入一、二阶差分,形成一39维的特征向量序列。
由于各次咳嗽持续时间不同,因此,候选咳嗽信号最终按帧转换为特征向量序列,例如持续时间为n帧的候选咳嗽序列对应为n列维数为39的特征向量序列;
(4)识别单元根据步骤(3)所提取的特征向量序列训练隐马尔可夫模型,对候选咳嗽信号进行识别,判断是否为咳嗽信号;
(5)对一定时间段内所述步骤(4)咳嗽识别所得的咳嗽信号进行统计。
所述步骤(2)中的端点检测,包括如下步骤:
(2-1)将步骤(1)的PCM格式的语音信号进行分帧;
(2-2)采用哈明窗对所述步骤(2-1)所得的每一帧信号进行加窗处理,并计算该帧内的短时过零率,构成候选过零率阈值集合;所述短时过零率满足:其中,Zn为短时过零率,x(.)为输入的PCM格式的语音信号,w(.)和sgn[x]分别为是哈明窗函数和符号函数,N=512;
(2-3)确定过零率阈值;
(2-4)识别候选咳嗽信号与非咳嗽信号,若短时过零率大于过零率阈值,则该帧被视为候选咳嗽信号,否则被视为非咳嗽信号而置零剔除;
(2-5)若持续数帧满足短时过零率大于过零率阈值,则将这些帧合并为一段声音信号,作为候选咳嗽信号,记录其起始点和终止点。
所述步骤(2-1)的分帧步骤为:以帧为单位读取PCM格式的语音信号,在取数据时,前一帧和后一帧的交叠部分为帧移。
帧长取32ms,即对应512个采样值;所述帧移为8ms,即对应128个采样值。
所述步骤(2-3)中的过零率阈值的确定步骤为:
(2-3-1)将所述步骤(2-2)获得的短时过零率按从小到大的顺序重新排列,记为{Z1,Z2,…,ZK};
(2-3-2)确定期望端点检测误判率,在所述步骤(2-3-1)选取相应的短时过零率作为过零率阈值,所述过零率阈值在步骤(2-3-1)所得集合{Z1,Z2,…,ZK}的排列序号满足:h=int(ε×K),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010217590.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子看板
- 下一篇:胎盘多肽注射液的多肽含量测定方法