[发明专利]一种高精度说话人确认方法无效
申请号: | 201310075089.3 | 申请日: | 2013-03-08 |
公开(公告)号: | CN103198833A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 罗森林;谢尔曼;潘丽敏 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于文本无关说话人确认方法。本发明提出了Turbo-Boost分类算法与2D-Haar音频特征的相结合的说话人确认方法,首先使用基础音频特征构成音频特征图;进而利用音频特征图提取2D-Haar音频特征,再使用Turbo-Boost算法,通过两轮迭代运算分别完成对2D-Haar音频特征的筛选和说话人分类器的训练;最终使用训练好的说话人分类器实现说话人确认。与现有技术相比,本发明可以在同样的运算消耗下获得更高的准确率,特别适合对于运算速度和说话人确认精度有着严格要求的说话人确认场合,例如电话自动接听系统、计算机身份认证系统、高密级门禁系统等。 | ||
搜索关键词: | 一种 高精度 说话 确认 方法 | ||
【主权项】:
一种高精度说话人确认方法,其特征在于,所述方法包括以下步骤: 步骤1,获取待确认说话人(即目标说话人)的语音信号,形成基础语音库S。 步骤2,对基础语音库S中的语音进行音频特征积分图计算,形成基础特征库R。 步骤3,在基础特征库R的基础上,生成每个目标说话人的训练特征文件集B。 步骤4,在步骤3的基础上,提取2D‑Haar音频特征,并进行说话人注册,也就是依次遍历特征文件集B中的k个文件夹,并使用其中的训练特征文件为每个目标说话人训练出单独的“1对余”分类器,最终得到由k个说话人分类器构成的分类器池。 步骤5,对用户提供的、申明是说话人k发声录制的语音文件,提取其2D‑Haar音频特征,输入步骤4训练得到的说话人k的分类器,以确认该文件中的语音是否确实由用户所申明的说话人讲出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310075089.3/,转载请声明来源钻瓜专利网。