[发明专利]一种基于机器学习及深度学习的声纹降噪方法及系统在审

申请号：	201810375197.5	申请日：	2018-04-24
公开（公告）号：	CN108831440A	公开（公告）日：	2018-11-16
发明（设计）人：	张夏林;朱文尧;谢俊;李宸;王晋;赵亚涛;夏雪	申请（专利权）人：	中国地质大学（武汉）
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/26;G10L17/00;G10L17/14;G10L21/0208
代理公司：	武汉知产时代知识产权代理有限公司 42238	代理人：	龚春来
地址：	430000 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于机器学习及深度学习的声纹降噪方法及系统。所述方法包括：采集野外地质工作环境下的环境音样品，对深度学习模型进行大量反复训练，获得训练好的深度语音学习模型。获取特定人说话音频，通过深度语音学习模型进行识别，将音频中的环境音过滤，判断过滤后的语音是否合格，得到经过初步筛查的语音，将初步筛查之后的语音与特定人声纹识别模型进行对比提取，进行降噪，判断降噪后的语音是否纯净，对声纹降噪后的语音进行增强，判断语音是否清晰，之后录入到语音输入系统。本发明能够解决野外地学数据采集时各种嘈杂噪声和环境音干扰情况下导致语音不纯，难以被语音文字识别软件准确识别出文字信息的问题，实现用语音文字识别方式的数据采集，提高野外地学数据采集的效率与准确性。
搜索关键词：	语音降噪环境音声纹地学数据基于机器语音文字语音学习采集筛查学习过滤野外语音输入系统识别软件数据采集文字信息野外地质录入噪声说话清晰
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于机器学习及深度学习的声纹降噪方法，其特征在于，包括如下步骤：S1、获取特定人在野外实地工作环境中对地质现象和地质认识描述的说话音频；S2、将步骤S1获取的所述说话音频通过机器学习及深度学习模型分别进行学习，对说话音频中夹杂的环境音进行识别区分；S3、将步骤S2中得到的识别过的语音进行过滤，剔除掉该语音中不属于所述特定人说话音频的环境音，得到经过初步筛查的语音；S4、判断经过初步筛查的语音信噪比是否达到预设的阈值，若否，则跳转步骤S3，若是，则继续步骤S5；S5、将步骤S4所述语音与该人声纹识别模型进行对比提取，保留与该人声纹识别模型相符合的语音频率及语谱图像，剔除掉与该人声纹识别模型不符合的语音，得到声纹降噪处理的语音；S6、判断声纹降噪处理后的语音中的人声纹纯净度是否达到预设的阈值，若否，则跳转步骤S5，若是，则继续步骤S7；S7、对步骤S6所述声纹降噪后的语音进行增强；S8、判断经过增强的语音清晰度是否达到预设的阈值，若否，则跳转步骤S7，若是则继续S9；S9、将步骤S8中获得的结果语音输出到语音文字识别系统，完成后续处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国地质大学（武汉），未经中国地质大学（武汉）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810375197.5/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于机器学习及深度学习的声纹降噪方法及系统在审

专利文献下载