[发明专利]基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法有效

申请号：	201810852508.2	申请日：	2018-07-30
公开（公告）号：	CN109300486B	公开（公告）日：	2021-06-25
发明（设计）人：	尹恒;付佳;何凌;郭春丽	申请（专利权）人：	四川大学
主分类号：	G10L25/66	分类号：	G10L25/66;G10L25/27;G10L25/30;G10L25/03
代理公司：	成都九鼎天元知识产权代理有限公司 51214	代理人：	阳佑虹
地址：	610041 四川***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法，涉及语音信号处理领域。所述方法利用分段指数压缩Gammatone滤波器组PICGTFs对语音进行滤波处理，分别基于多通道的Softsign模型SSMC(Softsign‑based Multi‑Channel)和高斯差分DoG(Difference of Gaussian)模型对各个通道的语音信号语谱图进行增强处理，将增强后的语谱图分别提取特征向量，并分别放入KNN分类器中进行模式识别，判断是否属于咽擦音，并取相同的分类结果作为算法最终的识别结果。该方法充分利用了咽擦音与正常语音在谱能量的频域分布上的差异，相比于现有技术，检测结果客观准确，实现较高程度的自动测量，在临床上对咽擦音的数字化评估提供可靠的参考数据，符合精准医疗的发展需求，进行更加准确有效的信号分类识别。
搜索关键词：	基于 picgtfs ssmc 增强腭裂语音擦音自动识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法，其特征在于，包括以下步骤：(1)信号预处理，对输入的语音信号进行幅值归一化、预加重、分帧和短时傅里叶变换；(2)对预处理后的信号进行基于分段指数压缩Gammatone滤波器组PICGTFs的滤波处理，得到滤波后的L个子带通道；(3)对滤波后的多子带通道语谱做基于多通道的Softsign模型SSMC对各个通道的语音信号语谱图进行增强处理，提取增强后各通道的谱均值作为特征向量F1；对滤波后的各通道的语谱图进行高斯差分DoG增强和规整化处理，利用分段三次Hermite插值多项式法PCHIP提取谱包络AP，并计算谱熵S，将二者作为特征向量F2；对滤波后的各通道的语谱图进行高斯差分DoG增强和规整化处理，利用Hilbert变换提取谱包络AH，并计算谱熵S，将二者作为特征向量F3；(4)在提取语音信号特征F1、F2和F3后，将各信号特征用于分类器中进行自动识别分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川大学，未经四川大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810852508.2/，转载请声明来源钻瓜专利网。

上一篇：音频信号的评分方法、装置、电子设备及计算机存储介质
下一篇：一种转盘式光盘库单轨实时定位装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法

[发明专利]基于PICGTFs和SSMC增强的腭裂语音咽擦音自动识别方法有效

专利文献下载