[发明专利]一种基于盲源分离的文本无关型多源说话人识别方法在审

专利信息
申请号: 202110137229.X 申请日: 2021-02-01
公开(公告)号: CN112967722A 公开(公告)日: 2021-06-15
发明(设计)人: 谭振华;徐晓梦 申请(专利权)人: 东北大学;赛尔网络有限公司
主分类号: G10L17/00 分类号: G10L17/00;G10L17/02;G10L17/18;G10L17/20;G10L21/0208
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 李珉
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分离 文本 无关 型多源 说话 识别 方法
【说明书】:

发明提供一种基于盲源分离的文本无关型多源说话人识别方法,涉及声纹识别技术领域。该方法首先获取一段包含多个人的语音的声源,并采用盲源信号检测与分离算法对声源进行盲源分离和检测,将多源语音信号分离出多个单源语音信号;再对分离出的每个单源语音信号进行预加重、分帧及加窗处理,得到时序语音信号;并对时序语音信号进行小波包分解与重构;然后采用耳蜗听觉滤波器进行人耳特征滤波,提取语音特征;最后构建CNN模型,将提取的语音特征输入到CNN模型,实现多源说话人识别;本发明方法采用小波包和伽马通滤波器相结合的方法,可以在噪声环境下,拥有较高的识别率。

技术领域

本发明涉及声纹识别技术领域,尤其涉及一种基于盲源分离的文本无关型多源说话人识别方法。

背景技术

语音作为生物识别的一种,与其它生物特征识别一样都承载着相应的信息,可以应用在身份认证、信息服务、语音邮件等方面。通过语音不仅可以得知说话者的语音内容信息,还可以得到说话者的信息即声纹识别。声纹识别就是通过对语音波形中包含的个人信息自动识别说话人的过程。在鸡尾酒环境下说话人识别存在很大的挑战性,首先鸡尾酒环境下很嘈杂,有很多说话人的声音混杂在一起。

说话人识别的过程可以分为两个部分:语音特征提取和说话者模型的训练。在语音特征提取方面,目前大多数研究主要针对语音信号的短期光谱特性,主要是基于约10-30毫秒的短帧对信号进行分解,这一时间段内语音信号最平稳,在此帧内对声纹的光谱特征进行研究,例如梅尔倒谱系数和线性倒谱系数。模型的训练,主要是针对提取出来的特征进行训练,例如常用的对于传统模型包括矢量量化模型和动态时间规整,高斯混合模型等;对于深度学习模型,采用深度神经网络,卷积神经网络等效果较好的模型应用于说话人识别的模型等。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于盲源分离的文本无关型多源说话人识别方法,在鸡尾酒环境下进行多源说话人识别。

为解决上述技术问题,本发明所采取的技术方案是:一种基于盲源分离的文本无关型多源说话人识别方法,针对鸡尾酒环境下的多声源语音,根据盲源信号检测与分离算法将多声源语音进行分离和检测,将包含的多个声源分离出来,然后针对每个声源进行语音特征提取即将语音进行小波包变换与伽马通滤波器相结合进行特征提取,同时将提取的特征通过深度学习模型CNN,完成多源说话人识别;具体包括以下步骤:

步骤1:盲源分离与检测;获取一段包含多个人的语音的声源,并采用盲源信号检测与分离算法对声源进行盲源分离和检测,将多源语音信号分离出多个单源语音信号;

首先将原始混合的语音数据矩阵进行归一化和白化处理得到白化变换的语音矩阵;然后采用随机的方式初始化一个矩阵W,并对矩阵W迭代进行去相关处理得到更新后的矩阵Wnew;最后将原始混合的语音数据矩阵和白化变换的语音矩阵以及更新后的矩阵Wnew做矩阵相乘,将多源语音信号分离出多个单源语音信号;

步骤2:语音特征预处理;对步骤1分离出的每个单源语音信号进行预加重、分帧及加窗处理,得到时序语音信号;

步骤3:对时序语音信号进行小波包分解与重构;

采用小波包对时序语音信号进行分解,以便对语音信号中包含的低频和高频信号进行时频局部化处理与分析;其中小波包按照完全最优二叉树方式分解,时频节点对应小波包频率系数;将小波包分解后的低频和高频语音信号进行重构,重构后语音信号的时序顺序对应原始的时域信息;

步骤4:采用耳蜗听觉滤波器对小波包分解与重构后的语音信号进行人耳特征滤波,提取语音特征;

将步骤3得到小波包分解与重构后的语音信号通过一组伽马通滤波器组得到符合人耳生理数据的语音特征向量,并对得到的语音特征向量进行短时傅里叶变换,得到二维语音特征向量,完成语音特征的提取;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学;赛尔网络有限公司,未经东北大学;赛尔网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110137229.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top