[发明专利]语音信息识别方法及装置有效
申请号: | 202011552655.1 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112767925B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 陈明翔;郭流芳;常战国 | 申请(专利权)人: | 贝壳技术有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/08;G10L25/33 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 蒋娟 |
地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信息 识别 方法 装置 | ||
本发明提供一种语音信息识别方法及装置,该方法包括:接收输入的原始语音识别文本,对原始语音识别文本进行扩增得到扩增语音识别文本;接收输入的至少一种语言特征的特征关键词,对特征关键词进行扩增得到扩增关键词;将各个语言特征的扩增关键词分别在扩增语音识别文本中进行搜索得到对应于各个语言特征的模糊匹配分数;根据各个语言特征的匹配分数得到原始语音识别文本是否符合各个语言特征的结果;其中,匹配分数包括模糊匹配分数。本发明提供的语音信息识别方法及装置,通过对特征关键词及原始语音识别文本进行扩增后匹配,根据匹配分数得到原始语音识别文本是否符合各个语言特征的结果,提高了语音信息识别的准确性及通用性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种语音信息识别方法及装置。
背景技术
随着深度学习技术的推广,当前的语音识别技术相较于传统方法已经有了很大的改善。然而由于训练数据的局限,以及不同场景下先验知识的不同,通用的语音识别模型在许多特定场景下,实用性仍然受到制约。
在某些情况下,比如受制于技术能力,或人力不足等原因,个人或组织常常没有足够的人力物力训练服务于特定场景的客制化语音识别模型。因此,如何提出一种语音信息识别方法,作为通用语音识别模型的补充,提高各种不同场景下的语音信息识别能力,成为亟待解决的问题。
发明内容
针对现有技术存在的问题,本发明提供一种语音信息识别方法及装置。
本发明提供一种语音信息识别方法,包括:接收输入的原始语音识别文本,对所述原始语音识别文本进行扩增得到扩增语音识别文本;接收输入的至少一种语言特征的特征关键词,对所述特征关键词进行扩增,得到扩增关键词;将各个所述语言特征的所述扩增关键词分别在所述扩增语音识别文本中进行搜索,根据搜索得到的第一匹配结果得到对应于各个所述语言特征的模糊匹配分数;根据各个所述语言特征的匹配分数得到所述原始语音识别文本是否符合各个所述语言特征的结果;其中,所述匹配分数包括所述模糊匹配分数。
根据本发明提供的一种语音信息识别方法,所述根据各个所述语言特征的匹配分数得到所述原始语音识别文本是否符合各个所述语言特征的结果,具体包括:若所述模糊匹配分数大于或等于预设分数阈值,则表示所述原始语音识别文本符合相应所述语言特征。
根据本发明提供的一种语音信息识别方法,所述将各个所述语言特征的所述扩增关键词分别在所述扩增语音识别文本中进行搜索,根据搜索得到的第一匹配结果得到对应于各个所述语言特征的模糊匹配分数,具体包括:将各个所述语言特征的所述扩增关键词在所述扩增语音识别文本中进行搜索,得到不同类型所述扩增关键词在所述扩增语音识别文本中的所述第一匹配结果;根据所述第一匹配结果获取匹配成功的所述扩增关键词;根据匹配成功的所述扩增关键词的数量、不同类型所述扩增关键词与所述特征关键词的特征匹配距离及预设的模糊系数得到所述模糊匹配分数。
根据本发明提供的一种语音信息识别方法,所述根据匹配成功的所述扩增关键词的数量、不同类型所述扩增关键词与所述特征关键词的特征匹配距离及预设的模糊系数得到所述模糊匹配分数,表示为:
其中,score1表示所述模糊匹配分数,i表示匹配成功的所述扩增关键词的序号,m表示匹配成功的所述扩增关键词的数量,C表示所述模糊系数,di表示与匹配成功的序号为i的所述扩增关键词与所述特征关键词的所述特征匹配距离。
根据本发明提供的一种语音信息识别方法,所述扩增语音识别文本包括所述原始语音识别文本,还包括文本拼音及文本无音调拼音中的至少一种;其中,所述文本拼音是基于所述原始语音识别文本进行有音调拼音提取得到的,所述文本无音调拼音是基于所述原始语音识别文本进行无音调拼音提取得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011552655.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置