[发明专利]一种基于Triplet-Loss的说话人识别方法在审

申请号：	201810835179.0	申请日：	2018-07-26
公开（公告）号：	CN109256139A	公开（公告）日：	2019-01-22
发明（设计）人：	王艺航;熊晓明;刘祥;李辉	申请（专利权）人：	广东工业大学
主分类号：	G10L17/18	分类号：	G10L17/18;G10L17/02
代理公司：	广东广信君达律师事务所 44329	代理人：	杨晓松
地址：	510062 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于Triplet‑Loss的说话人识别方法，包括以下步骤：S1：获取语音信号，包括三组样本，分别为说话人的一组语音序列、同一说话人另一组的语音序列以及不同说话人的一组语音序列；S2：进行语音信号的预处理，去除语音采集过程中产生的信道噪声；S3：对去噪后的语音信号进行语音特征参数提取；S4：以LSTM神经网络为基础，构建RNN神经网络；S5：将提取到的90％的三组语音特征参数作为RNN神经网络的输入，用于训练RNN神经网络；S6：RNN神经网络训练好后，将其余的10％的三组语音特征参数作为RNN神经网络的输入进行说话人识别。本发明具有准确率高、识别效果好、可靠性高等优点。
搜索关键词：	神经网络说话人识别语音信号语音序列语音特征参数语音特征参数提取预处理神经网络训练信道噪声语音采集准确率构建去噪去除样本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于Triplet‑Loss的说话人识别方法，其特征在于,包括以下步骤：S1：获取语音信号，该语音信号包括三组样本，分别为说话人的一组语音序列Xa、同一说话人另一组的语音序列Xp以及不同说话人的一组语音序列Xn；S2：进行语音信号的预处理，去除语音采集过程中产生的信道噪声；S3：对去噪后的语音信号进行语音特征参数提取；S4：以LSTM神经网络为基础，构建RNN神经网络；S5：将步骤S3所提取到的90％的三组语音特征参数作为RNN神经网络的输入，用于训练RNN神经网络；S6：RNN神经网络训练好后，将其余的10％的三组语音特征参数作为RNN神经网络的输入进行说话人识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东工业大学，未经广东工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810835179.0/，转载请声明来源钻瓜专利网。

上一篇：身份验证方法、终端设备及计算机可读存储介质
下一篇：一种录音方法、系统和音频分离方法、设备和存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Triplet-Loss的说话人识别方法在审

专利文献下载