[发明专利]一种病人虚弱语音端点检测方法有效
申请号: | 201210594590.6 | 申请日: | 2012-12-31 |
公开(公告)号: | CN103077728A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 尹岩岩;殷业;肖龙;关吉萍 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G10L25/66 | 分类号: | G10L25/66;G10L25/03;G10L21/06;G10L25/93;G10L25/84 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 吴泽群 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病人 虚弱 语音 端点 检测 方法 | ||
技术领域
本发明属于语音通信领域,具体涉及一种病人虚弱语音端点检测方法。
背景技术
未来人机交互最基本、最重要的手段是语音,而语音识别与合成是促使其普及发展的最关键技术。因此对语音识别的关键技术研究变的尤为重要。语音识别主要包括:语言特征提取、模式匹配和语言模型处理,其研究的对象分别是:语言特征序列、识别算法和语法语义分析。其中的关键技术有:端点检测,动态时间规整(DTW),隐形马尔科夫模型(HMM),人工神经网络(ANN)等。
端点检测通常依据的语音特征有短时能量、过零率、LPC距离、频谱熵、倒谱特征、TF参数、分形特征以及几种参数相结合,例如能零积、能零比、频能比、对数能量谱熵、子带谱熵、能频值等,但是这些参数性能过于单一,在低信噪比的条件下很难满足实际的需求。传统的端点检测特征参数LPC距离、倒谱特征、TF参数和分形特征等参数计算量太大,对硬件要求很高,阻碍了人机交互技术在日常生活中的普及适用。
发明内容
本发明提出一种病人虚弱语音端点检测方法,通过对语音信号波形的图像,或语音信号的频谱图像,包括时域的包络图像进行图像处理,运用图像处理中对图像轮廓边缘的检测,进行端点检测。
本发明的技术方案是:
一种病人虚弱语音端点检测方法,包括以下步骤:
将语音信号转换为图像,对此图像进行拉伸和放大,将拉伸和放大后的图像转换成二值图像;
对语音信号的波形包络所在区域进行开操作,即其中Θ为腐蚀,为膨胀,再取边界β(A);
β(A)=A-A(AΘB)进一步取波形轮廓,其中取边界β(A)为一个像素点;
使用平滑滤波器h(x)对信号进行滤波,得到其中为卷积;
对g(x)求两阶导数以检测边缘点;
找到音频最高点,搜索最高点两边的店,将前点和后点比较,若前点小于后点,则认为此最高点两边的两个点分别为词或音节的起始和结束点。
本发明的明显效果是:
这种方法比以往利用语音信号特征,例如能量,倒谱等人为找到的语音信息特征更为自然,更为简单和精确。因为人的肉眼对轮廓,边缘,间隔点的分辨率是相当高的。通过与人眼相对应的图像识别来区分语音信号的端点。图像处理从根本上说就是对人眼看到东西然后进行处理这一过程的一种机器模拟,所以这里用图像来识别比用机器对语音的其它特征进行处理来得更精确。
语音特征参数和图像识别结合在一起,能够发挥他们各自的长处,同时又可以在一定程度上规避他们各自的缺点,扩大了端点检测的隔离度,从而能够有效的应对各种不同类型的背景噪声。把图像识别应用于语音端点检测中具有重大的理论和现实意义。尤其是病人说话语音和普通话中的一些清音的检测效果更为明显。
附图说明
图1为本发明的流程图;
图2为本发明实施例中未经处理的原始语音波形图;
图3为本发明实施例中图2放大2.3倍后的波形图;
图4为本发明实施例中图3进一步拉伸后的波形图;
图5为本发明实施例中图2的二值图的语音波形图;
图6为本发明实施例中图5的波形轮廓图;
图7为本发明实施例中图2经平滑滤波和端点检测后的示意图;
图8为本发明实施例中通过传统特征进行检测方法检测后的波形图;
图9为本发明实施例中图8纵向横向拉伸后的波形图。
具体实施方式
以下结合附图和实施例对本发明进行进一步描述。
如图1所示,一种病人虚弱语音端点检测方法,包括以下步骤:
将语音信号转换为图像,对此图像进行拉伸和放大,将拉伸和放大后的图像转换成二值图像;
对语音信号的波形包络所在区域进行开操作,即其中Θ为腐蚀,为膨胀,再取边界β(A);
β(A)=A-A(AΘB)进一步取波形轮廓,其中取边界β(A)为一个像素点;
使用平滑滤波器h(x)对信号进行滤波,得到其中为卷积;
对g(x)求两阶导数以检测边缘点;
找到音频最高点,搜索最高点两边的店,将前点和后点比较,若前点小于后点,则认为此最高点两边的两个点分别为词或音节的起始和结束点。
本发明的技术原理是:
2.1短时平均过零率
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210594590.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:直角检测尺和楔形塞尺校准装置
- 下一篇:带夹持机构的百分表