[发明专利]一种声纹识别方法在审
申请号: | 201611231656.X | 申请日: | 2016-12-23 |
公开(公告)号: | CN108242239A | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 张学阳 | 申请(专利权)人: | 张学阳 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/12;G10L17/14;G10L25/24;G10L25/45;G10L25/78 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214000 江苏省无锡市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹识别 语音 人工智能领域 最优化算法 二次规划 方法识别 工厂机器 技术应用 建立模型 聚类迭代 模型训练 线性规划 训练模型 训练特征 银行安全 语音模型 语音识别 智能家居 复杂度 启发式 聚类 向量 一对一 加权 算法 引入 计算机 汽车 应用 | ||
1.一种声纹识别方法,包含声纹识别训练方法和声纹识别识别方法两个部分,本发明的训练方法和识别方法为:
1)录制多个人的不同文本内容的语音,通过语音的预处理阶段去除不相关语音,通过特征提取阶段获得人的声纹特征矢量;
2)对于每个人的声纹特征矢量建立模型,采用了一对一的SVM构建声纹模型,对于P个人,共构建个一对一svm模型;
3)在模型的求解过程采用SMO算法进行求解模型参数;
4)通过分析时间复杂度总结出训练模型的训练特征向量个数R和训练人数P与k-means迭代次数t的关系;
5)在识别阶段通过语音的预处理阶段去除不相关语音,通过特征提取阶段获得人的声纹特征矢量,然后通过加权聚类识别算法取出具有代表性的声纹特征;
6)根据得到的声纹特征,通过个SVM模型进行识别,最终得出待识别人。
2.如权利要求1所述的方法,其特征在于其中的步骤2)采用一对一的SVM模型和步骤5)通过加权聚类识别算法取出具有代表性的声纹特征,其中的具体过程如下
1)获得每个人的特征矢量v1,v2,…,vN;
2)根据k-means算法聚成指定的K类,每个类中心为c1,c2,…,cK;
3)将类中心依次代入一对一svm模型中并求临时得分tzij;
4)根据线性加权求解每个人的得分zt;
5)求出最大得分即为待识别人。
3.如权利要求1所述的方法,其特征在于其中的步骤4)中关于训练特征向量个数和训练人数与k-mean迭代次数t的关系:
1)当训练模型的训练特征向量个数R和训练人数P平方的乘机远远大于聚类迭代次数t时,即RP2>>t,SVM加权聚类识别方法识别速度有巨大提升。
2)当训练特征向量数目确定,随着训练人数的增加,加权聚类算法和直接方法所需识别时间都呈现了指数级的增长;
3)当训练人数确定时,随这训练特征向量个数的增加,加权聚类算法和直接方法所需识别时间都呈现出了线性的增长方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张学阳,未经张学阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611231656.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频文件生成方法及装置、终端设备
- 下一篇:复杂噪音下的声纹识别系统