[发明专利]语音识别方法及装置在审

申请号：	201510860662.0	申请日：	2015-11-30
公开（公告）号：	CN106816157A	公开（公告）日：	2017-06-09
发明（设计）人：	孙廷玮	申请（专利权）人：	展讯通信（上海）有限公司
主分类号：	G10L25/18	分类号：	G10L25/18;G10L25/21;G10L15/02
代理公司：	北京集佳知识产权代理有限公司11227	代理人：	郭学秀,吴敏
地址：	201203 上海市浦东新区张***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	语音识别方法及装置，所述语音识别方法包括将获取的待识别的声音数据划分为多个重叠的声音帧，并对每个声音帧进行快速傅立叶变换运算，得到对应的频谱；对所述多个声音帧的频谱进行遍历，将遍历到的当前声音帧的频谱划分为无重叠的多个子带；分别计算当前声音帧的多个子带的子带功率谱熵概率质量；根据当前声音帧的各个子带的子带功率谱熵概率质量，计算当前声音帧的子带功率谱熵；当确定当前声音帧的子带功率谱熵大于预设的阈值时，确定当前声音帧中包括语音信息。上述的方案，可以提高语音识别的速度和准确率。
搜索关键词：	语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种语音识别方法，其特征在于，包括：将获取的待识别的声音数据划分为多个重叠的声音帧，并对每个声音帧进行快速傅立叶变换运算，得到对应的频谱；对所述多个重叠的声音帧的频谱进行遍历，将遍历到的当前声音帧的频谱划分为无重叠的多个子带；分别计算当前声音帧的多个子带的子带功率谱熵概率质量；根据当前声音帧的各个子带的子带功率谱熵概率质量，计算当前声音帧的子带功率谱熵；当确定当前声音帧的子带功率谱熵大于预设的阈值时，确定当前声音帧中包括语音信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于展讯通信（上海）有限公司，未经展讯通信（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510860662.0/，转载请声明来源钻瓜专利网。

上一篇：一种提升语音传输信噪比的方法及装置
下一篇：一种语音质量评估方法、装置及设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法及装置在审

专利文献下载