[发明专利]语音识别方法、装置、设备和系统有效
申请号: | 201810677565.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN108831439B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李忠杰 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/26 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 陈金普 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 系统 | ||
本发明公开一种语音识别方法,包括步骤:获取语音信号;对语音信号进行解码处理,获得多个最佳路径;根据预先训练的用户模型,对多个最佳路径进行评价;根据评价结果,从多个最佳路径中提取与用户模型匹配的一个最佳路径作为目标最佳路径,并根据目标最佳路径确定语音信号的语音识别结果。还公开一种语音识别装置、语音识别设备和语音识别系统。通过语音信号进行解码得到多个最佳路径,并对多个最佳路径调用用户模型进行评价,根据评价结果最终得到语音识别结果,解决了传统语音识别技术中识别结果准确率较低的问题,大大提高识别结果的准确率。上述语音识别系统的识别准确率较高外,可有效提高用户个人信息的安全度。
技术领域
本发明涉及语音识别技术领域,特别是涉及一种语音识别方法、装置、设备和系统。
背景技术
随着智能交互技术的快速发展和市场需求的不断扩展,语音识别技术在近年来取得长足发展,至今已经在多个领域中得到广泛的应用。语音识别技术,顾名思义,就是对输入的语音信号进行识别,从而转换成计算机可处理的文本信息。利用语音识别技术可以实现众多应用场景中的智能语音交互,例如语音助手,基于语音识别的智能控制等。
传统的语音识别技术方案一般是系统接收到语音信号后进行特征提取,并基于提取的特征对语音信号进行分类计算,而后结合加权有限状态机(WFST)进行解码输出语音识别结果。然而,传统的语音识别技术的识别结果准确率仍然不高。
发明内容
基于此,本发明提供一种语音识别方法,一种语音识别装置,一种语音识别设备以及一种语音识别系统。
为实现上述目的,一方面,本发明实施例提供一种语音识别方法,包括步骤:
获取语音信号;
对所述语音信号进行解码处理,获得多个最佳路径;
根据预先训练的用户模型,对多个所述最佳路径进行评价;
根据评价结果,从多个所述最佳路径中提取与所述用户模型匹配的一个所述最佳路径作为目标最佳路径,并根据所述目标最佳路径确定所述语音信号的语音识别结果。
在其中一个实施例中,对所述语音信号进行解码处理,获得多个最佳路径的过程包括以下步骤:
对所述语音信号进行特征提取,得到对应的声学特征信息;
根据所述声学特征信息,通过预先构建的声学模型将所述语音信号分类为各个类别并确定对应的分类概率;
根据各个类别的所述语音信号及对应的所述分类概率,基于预先构建的WFST模块进行前向搜索,获得多个所述最佳路径。
在其中一个实施例中,根据各个类别的所述语音信号及对应的所述分类概率,基于预先构建的WFST模块进行前向搜索,获得多个最佳路径的步骤,包括:
基于预先构建的多个所述WFST模块分别进行独立前向搜索,获得与多个所述WFST模块分别对应的多个所述最佳路径。
在其中一个实施例中,根据各个类别的所述语音信号及对应的所述分类概率,基于预先构建的WFST模块进行前向搜索,获得多个最佳路径的步骤,还包括:
基于预先构建的多个所述WFST模块及对应的权重,进行同步前向搜索,获得与多个所述WFST模块对应的多个所述最佳路径。语音识别的准确率较高同时,大大提升识别速度。
在其中一个实施例中,在在根据评价结果,从多个所述最佳路径中提取与所述用户模型匹配的一个所述最佳路径作为目标最佳路径,并根据所述目标最佳路径确定所述语音信号的语音识别结果的步骤后,还包括:
若检测到所述语音识别结果包含新增的联系人信息、新增的自创词组和/或新增的特征语言信息,则根据所述新增的联系人信息、所述新增的自创词组和/或所述新增的特征语言信息,更新所述用户模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810677565.1/2.html,转载请声明来源钻瓜专利网。