[发明专利]基于深度学习的语音关键信息分离方法有效

专利信息
申请号: 202010681349.1 申请日: 2020-07-15
公开(公告)号: CN111883177B 公开(公告)日: 2023-08-04
发明(设计)人: 张建国;叶家艺;茅剑 申请(专利权)人: 厦门熙重电子科技有限公司;上海熙重科技有限公司;厦门熙佺文体科技有限公司
主分类号: G10L25/54 分类号: G10L25/54;G10L25/78;G10L25/30;G10L25/03
代理公司: 泉州市厦弘冠专利代理事务所(普通合伙) 35270 代理人: 王艺伟
地址: 361000 福建省厦门市火炬高新*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 语音 关键 信息 分离 方法
【说明书】:

发明公开的是基于深度学习的语音关键信息分离方法,包括以下步骤:CNN训练→语音信息标定→语音信息特征聚类→语音信息分离。本发明基于深度学习和聚类的人工智能方法,可以在尽可能减少人工干预的情况下,自动分离语音信号中关键语音信号。在此过程中,并不涉及语义分析,可避免传统语音分离处理流程中的累积误差,也可将本方法作为传统方法预处理手段,进一步提升语音分离效果。

技术领域

本发明涉及语音处理技术,具体的说是指基于深度学习的语音关键信息分离方法。

背景技术

语音作为关键的多媒体数据,在信息表达、存储、人机交互中有着重要作用,语音信号中包含着丰富的信息,语音信息检索是目前的重要研究热点。

目前的语音智能检索,常用手段为关键词检索、句子检索、文档检索。现有的检索手段大多依赖语音中的语义分析,检索方法步骤繁多,流程复杂,导致误差累积,准确率下降。

发明内容

本发明提供的是基于深度学习的语音关键信息分离方法,其主要目的在于克服现有语音检索方法步骤繁多、流程复杂,导致误差累积,准确率下降的问题。

为了解决上述的技术问题,本发明采用如下的技术方案:

基于深度学习的语音关键信息分离方法,包括以下步骤:

S1、CNN训练:将语音信号样本集作为训练数据,以待测关键信息为标签,利用CNN卷积神经网络对语音信号样本集进行训练,以获取一个语音信息分类模型,训练后获取的语音信息分类模型可以区分出不同语音信号中是否包含需要关注的关键信息;

S2、语音信息标定:基于训练好的语音信息分类模型,将待测语音信号经过语音信息分类模型,采用反向梯度激活平均算法及特征加权激活映射算法,在语音信号中自动标定所关注的信息;

S3、语音信息特征聚类:将待测的同类语音信号均通过语音信息标定算法分别生成语音信息标定向量,从而形成语音信息标定向量集;然后对语音信息标定向量集采用密度聚类方法,计算出聚类质心向量,即该类别语音信息典型特征分布向量;最后利用统计分析方法,计算语音信息典型特征分布向量中相邻峰值跃迁幅度,找出峰值跃迁幅度最大的两个峰值,计算语音信息分离阈值;

S4、语音信息分离:将目标语音信号序列与语音信息标定序列对齐,基于深度学习进行语音信号标定的过程中,生成语音信息标定序列时,采用插值填充的方法将语音信息标定序列拉伸至与原目标语音信号的相同长度,并将二者对齐;然后根据语音信息典型特征聚类计算得到的分离阈值,结合语音信息标定序列,设计滤波器,对目标语音信号逐点进行分离,将语音信号分离为包含所检索关键信息的关键语音信号和背景信号。

所述CNN卷积神经网络包括多个卷积层、多个池化层及全连接层,每个卷积层对应一个池化层,每个卷积层包括依次信号连接的一维卷积核Conv1D、批标准化层BN及ReLU激活层,所述ReLU激活层与对应的池化层信号连接,所述多个卷积层和多个池化层按照卷积层→池化层的重复顺序排布,所述全连接层与最后一个池化层连接。

所述反向梯度激活平均算法用于计算待测信号中语音信息特征分布,其计算公式为该计算公式中,定义的变量如下:

(1)K—语音信息特征向量个数(通道数);

(2)Z—语音信息特征向量的长度;

(3)C—语音信息的类别个数;

(4)Ak—第k个语音信息特征向量;

(5)—第k个语音信息特征向量中第i个特征的值;

(6)yc—语音信息类别c的分类得分;

(7)—第k个特征向量的权重;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门熙重电子科技有限公司;上海熙重科技有限公司;厦门熙佺文体科技有限公司,未经厦门熙重电子科技有限公司;上海熙重科技有限公司;厦门熙佺文体科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010681349.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top