[发明专利]基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法有效
申请号: | 201810852508.2 | 申请日: | 2018-07-30 |
公开(公告)号: | CN109300486B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 尹恒;付佳;何凌;郭春丽 | 申请(专利权)人: | 四川大学 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/27;G10L25/30;G10L25/03 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 阳佑虹 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 picgtfs ssmc 增强 腭裂 语音 擦音 自动识别 方法 | ||
本发明公开了一种基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法,涉及语音信号处理领域。所述方法利用分段指数压缩Gammatone滤波器组PICGTFs对语音进行滤波处理,分别基于多通道的Softsign模型SSMC(Softsign‑based Multi‑Channel)和高斯差分DoG(Difference of Gaussian)模型对各个通道的语音信号语谱图进行增强处理,将增强后的语谱图分别提取特征向量,并分别放入KNN分类器中进行模式识别,判断是否属于咽擦音,并取相同的分类结果作为算法最终的识别结果。该方法充分利用了咽擦音与正常语音在谱能量的频域分布上的差异,相比于现有技术,检测结果客观准确,实现较高程度的自动测量,在临床上对咽擦音的数字化评估提供可靠的参考数据,符合精准医疗的发展需求,进行更加准确有效的信号分类识别。
技术领域
本发明涉及语音信号处理领域,尤其是一种基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法。
背景技术
咽擦作为常见的代偿性构音错误之一,发生率仅次于声门塞音。它是由于发音人舌位后缩至后咽壁所导致咽部变窄而产生的一种擦音。该异常构音主要发生在普通话音节中的辅音部分,因为辅音是通过气流在口腔或咽头受到阻碍而形成的音。咽擦音在汉语方言中很常见,但是在正常的普通话发音中不会出现。咽擦音又分为清咽擦音和浊咽擦音。清咽擦音发音时声带不振动,而浊咽擦音在发音时声带振动,其气流特点是从肺部直接流出,而不是从口腔或声门流出。目前国内外主要通过以下两种方法对咽擦音进行诊断:(1)基于各种频谱分析仪观察语音频谱、鼻音分数检测仪测试的鼻音分数进行判断(2)基于临床特性,分析咽擦音与正常音在发音上的区别,其相应的方法都存在一定的缺陷或创伤性。
近年来,国内外学者致力于研究无创且更为客观的数字化处理方法,将其用于咽擦音的诊断与评估,以减轻病人治疗时的痛苦。目前,咽擦音的研究主要分为两类:1)基于数字化检测仪器的咽擦音特征分析,现有的相应研究利用数字化的医用检测仪测量鼻音分数、观察语音频谱变化,根据这些参数变化给出评估结果。但各个参数的变化仍为主观评估,依然存在不够客观和准确的问题。2)基于数字信号处理技术的咽擦音时频特征分析,对应的研究探讨了能量分布与咽擦音的关系,但并没有实现咽擦音与正常擦音的自动分类检测。
发明内容
本发明针对现有技术存在的上述技术问题,为避免噪声对信号识别产生干扰,利用分段指数压缩Gammatone滤波器组PICGTFs对语音进行滤波处理,分别基于多通道的Softsign模型SSMC(Softsign-based Multi-Channel)和高斯差分DoG(Difference ofGaussian)模型对各个通道的语音信号语谱图进行增强处理,将增强后的语谱图分别提取特征向量,并分别放入KNN分类器中进行模式识别,判断是否属于咽擦音,并取相同的分类结果作为算法最终的识别结果。该方法充分利用了咽擦音与正常语音在谱能量在频域分布上的差异,对咽擦音的自动识别具有重要的意义。
本发明采用以下技术方案:
一种基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法,其特征在于,包括以下步骤:
(1)信号预处理,对输入的语音信号进行幅值归一化、预加重、分帧和短时傅里叶变换;
(2)对预处理后的信号进行基于分段指数压缩Gammatone滤波器组PICGTFs的滤波处理,得到滤波后的L个子带通道;
(3)对滤波后的多子带通道语谱做基于多通道的Softsign模型SSMC对各个通道的语音信号语谱图进行增强处理,提取增强后各通道的谱均值作为特征向量F1;对滤波后的各通道的语谱图进行高斯差分DoG增强和规整化处理,利用分段三次Hermite插值多项式法PCHIP提取谱包络AP,并计算谱熵S,将二者作为特征向量F2;对滤波后的各通道的语谱图进行高斯差分DoG增强和规整化处理,利用Hilbert变换提取谱包络AH,并计算谱熵S,将二者作为特征向量提取的特征向量F3;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810852508.2/2.html,转载请声明来源钻瓜专利网。