[发明专利]一种利用短时时频值的自适应端点检测方法在审
申请号: | 201410292519.1 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104021789A | 公开(公告)日: | 2014-09-03 |
发明(设计)人: | 洪青阳;雷文钿;童峰 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种利用短时时频值的自适应端点检测方法,涉及说话人识别系统中的语音检测技术。语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;将预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;根据三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。可在复杂的背景噪声下,较为准确检测出语音的起点和终点,提高系统的识别准确率,减少识别时间,提高复杂环境下的说话人识别系统的性能。 | ||
搜索关键词: | 一种 利用 时时 自适应 端点 检测 方法 | ||
【主权项】:
一种利用短时时频值的自适应端点检测方法,其特征在于包括如下步骤:1)语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;2)将步骤1)预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;3)根据步骤2)中的三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;4)从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410292519.1/,转载请声明来源钻瓜专利网。