[发明专利]语音识别处理方法、装置、电子设备以及存储介质有效
申请号: | 202110488931.0 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113160822B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 夏帅;黄伟琦;江鹏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 处理 方法 装置 电子设备 以及 存储 介质 | ||
本申请提出了一种语音识别处理方法、装置、电子设备以及存储介质,涉及自然语言处理及语音技术领域等人工智能领域。具体实现方案为:确定所述语音识别的使用场景;根据所述使用场景获取对应的预置热词集合;在对语音信息进行语音识别并获得语音识别结果时,根据所述预置热词集合中各热词的第一拼音信息和所述语音识别结果的第二拼音信息,确定所述语音识别结果之中的待替换词和所述待替换词对应的目标热词;将所述语音识别结果之中的待替换词替换成所述对应的目标热词。本申请在无需附加人力及时间成本的前提下,降低了语音识别结果的出错率,也提升了特定场景下语音识别效果。
技术领域
本申请涉及计算机技术领域,具体涉及自然语言处理及语音技术领域等人工智能领域,尤其涉及一种语音识别处理方法、装置、电子设备及存储介质。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,简称ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。随着科学技术的发展,语音识别技术已被应用到人们的生活当中。
当前会议场景的语音识别技术中,会出现同一个词在不同领域中识别出不同的结果及专有名词识别错误的情况,如果对此专门的训练,会耗费大量的人力及时间成本,同时训练的过程相对复杂。
发明内容
本申请提供了一种用于语音识别处理的方法、装置、电子设备以及存储介质。
根据本申请的第一方面,提供了一种用于语音识别处理的方法,包括:
确定所述语音识别的使用场景;
根据所述使用场景获取对应的预置热词集合;
在对语音信息进行语音识别并获得语音识别结果时,根据所述预置热词集合中各热词的第一拼音信息和所述语音识别结果的第二拼音信息,确定所述语音识别结果之中的待替换词和所述待替换词对应的目标热词;
将所述语音识别结果之中的待替换词替换成所述对应的目标热词。
其中,所述预置热词集合中的热词包括:
根据所述使用场景的语音识别经验得出的热词;和/或,
在所述使用场景中的语音识别过程中,对语音识别结果进行校正操作时所使用的替换词。
在本申请实施例中,在将热词配置至所述预置热词集合之后,所述方法还包括:
获取所述热词中每个字的拼音;
如果所述热词中不存在多音字,则将所述热词中每个字的拼音进行组合,以得到所述热词的第一拼音信息;
如果所述热词中存在多音字,则将所述热词之中所述多音字的拼音和其他字的拼音从左到右进行两两排列组合,获得多个拼音排列组合结果;
将所述多个拼音排列组合结果作为所述热词的第一拼音信息。
在本申请的一些实施例中,所述根据所述预置热词集合中各热词的第一拼音信息和所述语音识别结果的第二拼音信息,确定所述语音识别结果之中的待替换词和所述待替换词对应的目标热词,包括:
确定所述预置热词集合中各热词的第一拼音信息;
对所述语音识别结果进行预处理;其中,所述预处理包括过滤标点符号、过滤特殊字符、英文字符中的至少一种;
将预处理后的所述语音识别结果转换为对应的拼音,以得到所述语音识别结果的第二拼音信息;
将所述各热词的第一拼音信息与所述语音识别结果的第二拼音信息进行对比,从所述第一拼音信息和所述第二拼音信息中确定出具有相同音节组成成分和结构的目标拼音;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110488931.0/2.html,转载请声明来源钻瓜专利网。