[发明专利]基于静音游程的语音识别方法及其系统有效
申请号: | 201610889689.7 | 申请日: | 2016-10-12 |
公开(公告)号: | CN107945807B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 涂岩恺;曹洪霞;王阳;牛方超 | 申请(专利权)人: | 厦门雅迅网络股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/06;G10L15/24 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 张明 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 静音 游程 语音 识别 方法 及其 系统 | ||
1.基于静音游程的语音识别方法,其特征在于,包括:
预设分别对应静音信号和非静音信号的二进制基本算符;
对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;
依据所述游程序列中的静音信号提取游程特征,并存储至数据库;
获取待识别的一段语音信号对应的待识别游程序列;
依据所述待识别游程序列中的静音信号提取待识别游程特征;
将所述待识别游程特征与数据库中的游程特征进行匹配。
2.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,所述游程特征包括游程距M1;
依据公式获取所述游程距M1,其中,所述I为游程序列中静音信号对应的二进制基本算符的游程长度的随机变量,P(I)为游程长度为I的游程数量与静音信号对应的二进制基本算符的总游程数量的比值。
3.如权利要求2所述的基于静音游程的语音识别方法,其特征在于,所述游程特征还包括游程中心距M2、游程绝对矩M3、游程熵M4和游程方差M5;
依据公式获取所述游程中心距M2;
依据公式获取所述游程绝对矩M3;
依据公式获取所述游程熵M4;
依据公式获取所述游程方差M5。
4.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,所述对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列,具体为:
预设语音强度阈值;
获取大于预设长度的一段语音模拟信号;
依据所述语音强度阈值,逐个确定所述语音模拟信号为静音信号还是非静音信号;
依据静音信号和非静音信号各自对应的二进制基本算符,将所述语音模拟信号转换成由二进制基本算符组成的游程序列。
5.如权利要求1所述的基于静音游程的语音识别方法,其特征在于,数据库中存储的游程特征的个数为两个以上;对应各游程特征预设唯一的标识符。
6.如权利要求5所述的基于静音游程的语音识别方法,其特征在于,将所述待识别游程特征与数据库中的游程特征进行匹配,具体为:
依据欧式距离公式,分别计算所述待识别游程特征与数据库中存储的各个游程特征的特征距离;
获取数值最小的特征距离对应的游程特征的标识符。
7.基于静音游程的语音识别系统,其特征在于,包括:
预设模块,用于预设分别对应静音信号和非静音信号的二进制基本算符;
转换模块,用于对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;
第一提取模块,用于依据所述游程序列中的静音信号提取游程特征,并存储至数据库;
获取模块,用于获取待识别的一段语音信号对应的待识别游程序列;
第二提取模块,用于依据所述待识别游程序列中的静音信号提取待识别游程特征;
匹配模块,用于将所述待识别游程特征与数据库中的游程特征进行匹配。
8.如权利要求7所述的基于静音游程的语音识别系统,其特征在于,所述提取模块提取的游程特征包括游程距M1、游程中心距M2、游程绝对矩M3、游程熵M4和游程方差M5;
依据公式获取游程距M1,其中,所述I为游程序列中静音信号对应的二进制基本算符的游程长度的随机变量,P(I)为游程长度为I的游程数量与静音信号对应的二进制基本算符的总游程数量的比值;
依据公式获取所述游程中心距M2;
依据公式获取所述游程绝对矩M3;
依据公式获取所述游程熵M4;
依据公式获取所述游程方差M5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门雅迅网络股份有限公司,未经厦门雅迅网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610889689.7/1.html,转载请声明来源钻瓜专利网。