[发明专利]音频识别方法和装置、录音终端及服务器、存储介质有效
申请号: | 202010852414.2 | 申请日: | 2020-08-21 |
公开(公告)号: | CN111986657B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 沈忱;梁志婷;李健;王玉好 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L25/48;G10L25/78;G10L25/84 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 200232 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 方法 装置 录音 终端 服务器 存储 介质 | ||
本发明公开了一种音频识别方法和装置、录音终端及服务器、存储介质。其中,该方法包括:获取原始音频数据;基于语音活动检测VAD按照至少两种语音强度生成至少两个参考音频文件;对至少两个参考音频文件分别进行识别标记,得到每个参考音频文件中的语音标记数据;其中,语音标记数据用于指示参考音频文件中的语音片段;将至少两个参考音频文件和各自对应的语音标记数据发送至服务器,以使服务器从至少两个参考音频文件中确定出目标音频文件,并分离出目标音频文件中的语音片段和噪音片段。本发明解决了相关技术提供的音频识别方法存在识别处理操作较为复杂的技术问题。
技术领域
本发明涉及语音处理和识别技术领域,具体而言,涉及一种音频识别方法和装置、录音终端及服务器、存储介质。
背景技术
在对语音采用自动语音识别技术(Automatic Speech Recognition,简称ASR)进行转录前,需要对同一段音频文件中不同人的声音进行分离。但当录音设备有多个时,就需要对多个录音设备各自的音轨进行噪音处理,也就需要对多路音轨同时进行语音和噪声分离才能完成ASR的转录工作。
也就是说,目前相关技术提供的音频识别方法存在识别处理操作较为复杂的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种音频识别方法和装置、录音终端及服务器、存储介质,以至少解决相关技术提供的音频识别方法存在识别处理操作较为复杂的技术问题。
根据本发明实施例的一个方面,提供了一种音频识别方法,包括:获取原始音频数据;基于语音活动检测VAD按照至少两种语音强度生成至少两个参考音频文件;对上述至少两个参考音频文件分别进行识别标记,得到每个参考音频文件中的语音标记数据;其中,上述语音标记数据用于指示上述参考音频文件中的语音片段;将上述至少两个参考音频文件和各自对应的上述语音标记数据发送至服务器,以使上述服务器从上述至少两个参考音频文件中确定出目标音频文件,并分离出上述目标音频文件中的语音片段和噪音片段。
根据本发明实施例的另一方面,还提供了一种音频识别方法,包括:接收录音终端发送的至少两个参考音频文件以及各自对应的语音标记数据;其中,上述至少两个参考音频文件是基于语音活动检测VAD按照至少两种语音强度生成的,上述语音标记数据用于指示上述参考音频文件中的语音片段;基于自动语音识别ASR从至少两个上述参考音频文件中,确定出目标音频文件;根据上述目标音频文件对应的语音标记数据以及上述目标音频文件中噪音的强度值,分离上述目标音频文件中的语音片段和噪音片段。
根据本发明实施例的又一方面,还提供了一种音频识别装置,包括:第一获取单元,用于获取原始音频数据;第一处理单元,用于基于语音活动检测VAD按照至少两种语音强度生成至少两个参考音频文件;第一标记单元,用于将上述至少两个参考音频文件分别进行识别标记,得到每组参考音频文件对应的语音标记数据;其中,上述语音标记数据用于指示上述参考音频文件中的语音片段;第一发送单元,用于将上述至少两个参考音频文件和各自对应的上述语音标记数据发送至服务器,以使上述服务器从上述至少两个参考音频文件中确定出目标音频文件,并分离出上述目标音频文件中的语音片段和噪音片段。
根据本发明实施例的又一方面,还提供了一种音频识别装置,包括:第一接收单元,用于接收录音终端发送的至少两个参考音频文件以及各自对应的语音标记数据,其中,上述至少两个参考音频文件是基于语音活动检测VAD按照至少两种语音强度生成的,上述语音标记数据用于指示上述参考音频文件中的语音片段;第一确定单元,用于基于自动语音识别ASR从至少两个上述参考音频文件中,确定出目标音频文件;第一分离单元,用于根据上述目标音频文件对应的语音标记数据以及上述目标音频文件中噪音的强度值,分离上述目标音频文件中的语音片段和噪音片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010852414.2/2.html,转载请声明来源钻瓜专利网。