[发明专利]一种多基频提取方法及装置有效
申请号: | 201511023725.3 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105469807B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 刘文举;江巍;王天正;李杰;梁基重;李艳鹏;乔利玮;刘元华 | 申请(专利权)人: | 中国科学院自动化研究所;国网山西省电力公司电力科学研究院;山西振中电力股份有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L15/14 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于经验模式分解和隐马尔可夫模型的多基频提取方法及装置。方法包括:用听觉滤波器组对语音信号进行滤波,对滤波后的信号进行分帧;在听觉谱的各时频单元上计算自相关函数;在经验模式分解得到的本质模态函数的基础上计算各时频单元主导声源的瞬时频率;在各瞬时频率的基础上计算频率匹配函数;用频率匹配函数构建各基频状态的似然概率,并使用语料库统计各基频状态和基频数值之间的转移概率;将所述各基频状态的似然概率进行增强,然后将增强后的所述似然概率与对应的转移概率结合,并使用隐马尔可夫模型对所述语音信号的多基频轨迹进行提取。 | ||
搜索关键词: | 一种 基频 提取 方法 装置 | ||
【主权项】:
1.一种基于经验模式分解和隐马尔可夫模型的多基频提取方法,其特征在于,包括下列步骤:步骤1:用听觉滤波器组对语音信号进行滤波,对滤波后的信号进行分帧,得到语音信号的二维时频表达即听觉谱;步骤2:在听觉谱的各时频单元上计算自相关函数;步骤3:对各时频单元的自相关函数进行经验模式分解,并在经验模式分解得到的本质模态函数的基础上计算各时频单元主导声源的瞬时频率;步骤4:在各瞬时频率的基础上计算频率匹配函数;步骤5:用频率匹配函数构建各基频状态的似然概率,并使用语料库统计各基频状态和基频数值之间的转移概率;所述各基频状态包括单基频状态和双基频状态;步骤6:将所述各基频状态的似然概率进行增强,然后将增强后的所述似然概率与对应的转移概率结合,并使用隐马尔可夫模型对所述语音信号的多基频轨迹进行提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;国网山西省电力公司电力科学研究院;山西振中电力股份有限公司,未经中国科学院自动化研究所;国网山西省电力公司电力科学研究院;山西振中电力股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201511023725.3/,转载请声明来源钻瓜专利网。
- 上一篇:隧道磁阻器件和隧道磁阻读磁头
- 下一篇:全自动外语语音现场控制汽车驾驶的方法