[发明专利]声音识别方法和系统有效
申请号: | 201811051604.3 | 申请日: | 2018-09-10 |
公开(公告)号: | CN110890085B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 薛少飞;张仕良 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/16;G10L15/02 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 褚敏;宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 方法 系统 | ||
本申请公开了一种声音识别方法和系统。其中,该方法包括:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC‑BLSTM模型和DFSMN模型。本申请解决了现有技术中声音识别方法在复杂环境中的识别准确率不高的技术问题。
技术领域
本申请涉及语音识别领域,具体而言,涉及一种声音识别方法和系统。
背景技术
声学模型训练是一个语音识别系统的核心部分,占据着大部分的计算开销并在很大程度上决定着系统的识别性能,它利用训练语音特征及其对应的标注信息进行有监督的声学模型建模。随着深度学习在声学模型建模中的应用,语音识别准确率不断提高,诸如DNN(深度神经网络,Deep Neural Network)、LSTM(长短时记忆网络,Long Short-TermMemory)、BLSTM(双向长短时记忆网络,Bidirectional Long Short-Term Memory)、CNN(卷积神经网络,Convolutional Neural Network)、FSMN(前馈型序列记忆网络,Feed-forwardSequential Memory Network)等模型结构被提出并使用在了模型建模中。语音识别模型的建模能力在很大程度上会决定识别的效果,传统的DNN、LSTM等模型在复杂环境下效果不够理想。
针对现有技术中声音识别方法在复杂环境中的识别准确率不高的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种声音识别方法和系统,以至少解决现有技术中声音识别方法在复杂环境中的识别准确率不高的技术问题。
根据本申请实施例的一个方面,提供了一种声音识别方法,包括:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC-BLSTM模型和DFSMN模型。
根据本申请实施例的另一方面,还提供了一种声音识别系统,包括:声学特征提取模块,用于对获取到的声音信号进行特征提取,得到声音信号的声学特征信息;解码器,用于利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC-BLSTM模型和DFSMN模型。
根据本申请实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行如下步骤:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC-BLSTM模型和DFSMN模型。
根据本申请实施例的另一方面,还提供了一种移动设备,包括:处理器,处理器用于运行程序,其中,在程序运行时执行以下步骤:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC-BLSTM模型和DFSMN模型。
根据本申请实施例的另一方面,还提供了一种声音识别系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取声音信号;对声音信号进行特征提取,得到声音信号的声学特征信息;利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别结果,其中,声学模型包括:LC-BLSTM模型和DFSMN模型。
在本申请实施例中,在获取到语音信息之后,可以对声音信号进行特征提取,得到声音信号的声学特征信息,进一步地,可以利用声学模型和语言模型对声学特征信息进行识别,得到声音信号的识别,从而实现声音识别的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811051604.3/2.html,转载请声明来源钻瓜专利网。