[发明专利]一种对文本无关的声纹进行识别的方法无效
申请号: | 201110160572.2 | 申请日: | 2011-06-15 |
公开(公告)号: | CN102831890A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 周晓东;刘镇 | 申请(专利权)人: | 镇江佳得信息技术有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 无关 声纹 进行 识别 方法 | ||
技术领域
本发明属于语音信号处理领域,涉及于对文本无关的声纹进行识别的方法。
背景技术
由于每个人的发音器官不同,所发出来的声音极其音调各不相同,因此声纹作为基本特征来实现人的身份识别具有实际的不可替代性和稳定性。从声纹识别的使用场合来看,需要判别的声音其来源基本分为3中情况,即文本提示型、文本相关型和文本无关型。文本提示型和文本相关型都需要用户根据规定的内容发音,并根据发音的内容建立模型进行匹配,虽然这样可以使得匹配效果较好,但需要用户完全配合,灵活性和容错性欠佳;而对于文本无关型则不规定说话人的声音内容,只要系统中录有说话人的声音就能够识别是否为该说话人,因此对文本无关的声纹进行识别的技术含量要求比较高,它不仅仅需要解决匹配判断问题,还需要预先提取说话人的语音特征,才能进行判断。
发明内容
本发明发明的一种对文本无关的声纹进行识别的方法,包括以下步骤:
输入待识别人的语音信号步骤;
对所述输入的语音信号进行预处理步骤;
对所述输入的语音信号进行特征值提取步骤;
根据所述提取的特征值建立待识别人的声学模型步骤;
将所述声学模型与语音特征库中的全部声学模型进行匹配步骤;
返回计算所得最为匹配的模型编号,以此确定所述待识别的具体身份步骤;
在所述声学模型与语音特征库中的全部声学模型进行匹配步骤中,所述的全部声学模型的建立是采用预先收录用户客人的语音信号建立的,建立声学模型的步骤为:
采集所述客人的连续语音作为输入信号步骤;
对所述客人的连续语音信号进行预处理步骤;
对所述客人的连续语音信号进行特征值提取步骤;
对所提取的客人的连续语音信号的特征值建立声学模型步骤;
将所述客人的声学模型存储在语音特征库中。
本发明发明的对文本无关的声纹进行识别的方法识别效率高,结果准确。
附图说明
下面结合附图对本发明的具体实施方案做进一步说明。
图1为本发明发明的一种对文本无关的声纹进行识别的方法中的建立针对用户集得全部声学模型步骤流程图。
图2为本发明发明的一种对文本无关的声纹进行识别的方法中的针对当前待识别用户进行模型匹配和识别的步骤流程图。
具体实施方案
本发明发明的一种对文本无关的声纹进行识别的方法的步骤流程图如图1所示,包含以下步骤:
首先建立针对用户集的全部声学模型,步骤流程图如图1所示:通过外围音频采集设备对用户的说话人语音信号进行采集;对采集到得连续语音信号进行预处理;对采集到的连续语音信号进行特征值提取;使用提取到的特征值对建立该说话人的声学模型;将该声学模型存储在语音特征库中;
然后针对当前待识别用户进行模型匹配和识别,步骤流程图如图1所示:利用外围音频采集设备采集说话人的语音信号;对采集到得连续语音信号进行预处理;对采集到的连续语音信号进行特征值提取;使用提取到的特征值对建立当前说话人的声学模型;将当前说话人的声学模型与语音特征库中的全部声学模型进行匹配;返回计算所得最为匹配的模型编号,以此确定所述待识别人的具体身份。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江佳得信息技术有限公司,未经镇江佳得信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110160572.2/2.html,转载请声明来源钻瓜专利网。