[发明专利]一种面向特定人群的语音识别方法有效
申请号: | 201010234226.X | 申请日: | 2010-07-23 |
公开(公告)号: | CN101944359A | 公开(公告)日: | 2011-01-12 |
发明(设计)人: | 熊伟;刘伟;王飞浪;谢伟良;陈鑫娜;陈鹏;熊俱扬;熊鑫 | 申请(专利权)人: | 杭州网豆数字技术有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/02 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 特定 人群 语音 识别 方法 | ||
1.一种面向特定目标人群的语音识别方法,其特征在于,包括:
(1)对语音信号进行采样,将语音信号由模拟信号转换至数字信号;
(2)对语音信号进行前端处理;
(3)提取语音信号的特征参数;
(4)采用离散隐马尔可夫模型对语音信号进行识别。
2.如权利要求1所述的语音识别方法,其特征在于,对语音信号进行采样的采样信号为8kHz。
3.如权利要求1所述的语音识别方法,其特征在于,所述的对语音信号进行前端处理包括预加重、加窗分帧和端点检测。
4.如权利要求3所述的语音识别方法,其特征在于,所述的预加重为对语音信号作+6dB/倍频程的高频提升。
5.如权利要求3所述的语音识别方法,其特征在于,所述的加窗分帧操作中采用的帧长大于目标人群语音频谱中基调周期的两倍,帧移为帧长的一半。
6.如权利要求1所述的语音识别方法,其特征在于,所述的提取语音信号的特征参数包括:
a、对语音信号进行离散小波变换,将语音信号划分为若干个频带,计算每个频带上的小波分解系数,频带的划分基于目标人群频谱中语音元素的频率分布;
b、将各个频带上的小波系数分别作快速傅里叶变换,再通过一级量化后,将所有频带上的频谱拼接成完整的语音频谱,计算完整语音频谱的频谱能量;
c、将完整语音频谱的频谱能量通过梅尔滤波器组,计算梅尔滤波器组的输出;
d、对梅尔滤波器组的输出进行对数变换和离散余弦变换得到语音信号的特征参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网豆数字技术有限公司,未经杭州网豆数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010234226.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于整形小波变换的音频无损压缩编码、解码方法
- 下一篇:LED灯盘