[发明专利]基于静音游程的语音识别方法及其系统有效
申请号: | 201610889689.7 | 申请日: | 2016-10-12 |
公开(公告)号: | CN107945807B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 涂岩恺;曹洪霞;王阳;牛方超 | 申请(专利权)人: | 厦门雅迅网络股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/06;G10L15/24 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 张明 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 静音 游程 语音 识别 方法 及其 系统 | ||
本发明提供基于静音游程的语音识别方法及其系统,方法包括:预设分别对应静音信号和非静音信号的二进制基本算符;对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;依据游程序列中的静音信号提取游程特征,并存储至数据库;获取待识别的一段语音信号对应的待识别游程序列;依据所述待识别游程序列中的静音信号提取待识别游程特征;将所述待识别游程特征与数据库中的游程特征进行匹配。本发明依据静音特征反映出的说话节奏变化、频率、停顿等个性化区别,更准确的从数据库中识别出与待识别语音信号最为匹配的语音信号,进而为待识别语音信号的身份确认提供准确的依据。
技术领域
本发明涉及语音识别领域,具体说的是基于静音游程的语音识别方法及其系统。
背景技术
说话人识别是指根据人的语音信号由程序自动判断出说话者的身份,属于计算机生物特征识别的一种,可用于智能身份鉴别。一般语音信号可分为有声部分和静音部分(即说话中的无声停顿部分),由于静音部分不包含语音信息,因此在传统的说话人识别方法中一般都是将静音部分去除,提取有声信号的特征进行识别,例如基音周期、过零率、明亮度、线性预测系数、线性预测倒谱系数、MFCC、LPCC等特征。传统方法对于说话人识别的准确率达到一定水平后难以继续大幅提高,需要寻找新的识别特征和识别方法。
发明内容
本发明所要解决的技术问题是:提供一种基于静音游程的语音识别方法及其系统,有效提高语音识别的准确度。
为了解决上述技术问题,本发明采用的技术方案为:
基于静音游程的语音识别方法,包括:
预设分别对应静音信号和非静音信号的二进制基本算符;
对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;
依据所述游程序列中的静音信号提取游程特征,并存储至数据库;
获取待识别的一段语音信号对应的待识别游程序列;
依据所述待识别游程序列中的静音信号提取待识别游程特征;
将所述待识别游程特征与数据库中的游程特征进行匹配。
本发明提供的另一个技术方案为:
基于静音游程的语音识别系统,包括:
预设模块,用于预设分别对应静音信号和非静音信号的二进制基本算符;
转换模块,用于对所获取的一段语音信号中的静音信号和非静音信号依据对应的二进制基本算符进行转换,获取由二进制基本算符组成的游程序列;
第一提取模块,用于依据所述游程序列中的静音信号提取游程特征,并存储至数据库;
获取模块,用于获取待识别的一段语音信号对应的待识别游程序列;
第二提取模块,用于依据所述待识别游程序列中的静音信号提取待识别游程特征;
匹配模块,用于将所述待识别游程特征与数据库中的游程特征进行匹配。
本发明的有益效果在于:区别于现有技术的语音识别技术均是基于有声部分的特征进行识别,其准确率难以再提升的困境。本发明提供一种基于静音游程的语音识别方法,通过提取语音信号中的静音特征,依据静音特征反映出的说话节奏变化、频率、停顿等个性化区别,从而更准确的从数据库中识别出与待识别语音信号最为匹配的语音信号,进而为待识别语音信号的身份确认提供准确的依据。
附图说明
图1为本发明基于静音游程的语音识别方法的流程示意图;
图2为本发明将语音声波转换得到静音部分的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门雅迅网络股份有限公司,未经厦门雅迅网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610889689.7/2.html,转载请声明来源钻瓜专利网。