[发明专利]一种音频识别方法、装置及电子设备在审
申请号: | 202210541733.0 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114927132A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 贾彦;汪俊杰 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F16/35;G06F40/258;G10L15/06;G10L15/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张影 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 识别 方法 装置 电子设备 | ||
本申请公开了一种音频识别方法、装置及电子设备,通过对待识别音频信息进行初始文本识别,获得初始识别结果;基于初始识别结果,确定与初始识别结果对应的至少一个实时主题;基于每一实时主题对其对应的子识别将结果进行处理,得到与待识别音频信息对应的目标识别结果。能够通过在音频识别过程中获得实时主题,基于实时主题对音频进行识别,提升了音频识别的准确性。
技术领域
本申请涉及信息处理技术领域,更具体的说是涉及一种音频识别方法、装置及电子设备。
背景技术
目前,音频交互方式已经成为了一种更加便捷的交互方式,在一些应用场景中需要将音频转换为文本,再进行后续的处理,如智能交互、意图识别等。但是,在一些复杂的应用场景中,音频识别仍会存在识别不准确的问题,影响了后续的应用。
发明内容
有鉴于此,本申请提供如下技术方案:
一种音频识别方法,包括:
对待识别音频信息进行初始文本识别,获得初始识别结果;
基于所述初始识别结果,确定与所述初始识别结果对应的至少一个实时主题;
基于每一实时主题对其对应的子识别结果进行处理,得到与所述待识别音频信息对应的目标识别结果;
其中,所述对应的子识别结果为所述初始识别结果中与实时主题对应的文本信息。
可选地,所述对待识别音频信息进行初始文本识别,获得初始识别结果,包括:
将待识别音频信息输入至音频识别模型,以使得基于所述音频识别模型获得初始识别结果,所述音频识别模型为基于第一训练样本确定的模型,所述第一训练样本为标注有文本信息的音频数据。
可选地,所述基于所述初始识别结果,确定与所述初始识别结果对应的至少一个实时主题,包括:
获取初始识别结果关联的第一识别结果;
基于所述初始识别结果和所述第一识别结果,确定与所述初始识别结果对应的至少一个实时主题。
可选地,所述获取初始识别结果关联的第一识别结果,包括:
获取所述初始文本识别对应的识别模式的处理频率参数;
基于所述处理频率参数,获取与初始识别结果关联的第一识别结果。
可选地,所述基于所述初始识别结果和所述第一识别结果,确定与所述初始识别结果对应的至少一个实时主题,包括:
将所述初始识别结果和所述第一识别结果输入至主题识别模型,以通过所述主题识别模型获得至少一个实时主题,其中,所述主题识别模型为通过标注有主题信息的文本训练得到的模型。
可选地,所述基于每一实时主题对应的子识别结果进行处理,得到与所述待识别音频信息对应的目标识别结果,包括:
基于与每一子识别结果对应的实时主题对每一所述子识别结果进行处理,得到第二识别结果;
对每一所述子识别结果和所述第二识别结果进行融合处理,得到目标子识别结果;
将每一目标子识别结果进行组合,得到与所述待识别音频信息对应的目标识别结果。
可选地,所述基于与每一实时主题对应的子识别结果进行处理,得到与所述待识别音频信息对应的目标识别结果,包括:
基于与每一实时主题对应的子识别结果进行处理,得到与每一实时主题对应的实时识别结果;
基于所述初始识别结果和所述实时识别结果,确定与所述待识别音频信息对应的目标识别结果。
可选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210541733.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承表面淬火处理设备
- 下一篇:一种地质资源勘查智能旋切采样装置