[发明专利]音频的处理方法和装置在审
申请号: | 202010920160.3 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112183107A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 杨宇庭;徐广平;钱莉;杜俊 | 申请(专利权)人: | 华为技术有限公司;中国科学技术大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G10L15/22 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 张卿;时林 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 | ||
本申请提供了人工智能领域中的一种音频处理方法和电子装置。音频处理方法应用于会议系统,会议系统包括至少一个音频采集设备。音频处理方法包括:接收至少一个音频采集设备采集的至少一段音频;确定至少一段音频中多个目标的语音;分别对多个目标中每个目标的语音进行语音识别,以获取每个目标的语音对应的语义。对不同目标的语音分别进行语音识别,提高了语音识别的准确性。
技术领域
本申请涉及人工智能(artificial intelligence,AI)领域,具体涉及自然语言处理领域,尤其涉及一种音频的处理方法及装置。
背景技术
人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。
随着人工智能技术的不断发展,让人机之间能够通过自然语言进行交互的自然语言人机交互系统变的越来越重要。人机之间能够通过自然语言进行交互,就需要系统能够识别出人类自然语言的具体含义。通常,系统通过采用对自然语言的句子进行关键信息提取来识别句子的具体含义。
广义的自然语言处理包含了对语音的处理。按照音频中语音的先后顺序进行语音识别,确定的语义准确性较低。
发明内容
本申请提供一种音频的处理方法和装置,能够提高对系统采集的音频中各个目标的语音进行语音识别得到的语义的准确性。
第一方面,提供了一种音频处理方法,该方法可以应用于会议系统,所述会议系统包括至少一个音频采集设备。所述方法包括:接收所述至少一个音频采集设备采集的至少一段音频;确定所述至少一段音频中多个目标的语音;分别对所述多个目标中每个目标的语音进行语音识别,以获取每个所述目标的语音对应的语义。
在一段时间内,一个目标的语音对应的语义一般存在着逻辑上的关联性。在会议过程中,多个目标可能交替发言,即各个目标的语音交替出现。一个目标的前后语句上的依赖关系会更强。对每个目标的语音分别进行处理,可以提高语音识别的准确性。
结合第一方面,在一些可能的实现方式中,所述确定所述至少一段音频中多个目标的语音,包括:判断待处理语音是否为所述多个目标中第一目标的语音,所述待处理语音是从所述至少一段音频中确定的;当所述待处理语音不是所述第一目标的语音时,对所述待处理语音进行语音分离,以获得分离语音;识别所述分离语音对应的目标。
在会议过程中,仅在很少的情况下会存在语音重叠。大多数情况,语音不会存在重叠。为了分别对每个目标的语音进行识别,需要确定每个未重叠的语音对应的目标,以及每个分离后的语音对应的目标。可以对每个待处理语音进行目标识别,之后,对于与不是与目标对应的待处理语音进行语音分离,无需对每个待处理语音进行重叠检测或语音分离,降低对资源的占用。
结合第一方面,在一些可能的实现方式中,所述方法还包括:当所述待处理语音不是所述第一目标的语音时,判断所述待处理语音是否存在语音重叠;所述对所述待处理语音进行语音分离,包括:当所述待处理语音存在语音重叠时,对所述待处理语音进行语音分离。
对于与不是与目标对应的待处理语音进行重叠检测,在待处理语音存在语音重叠时进行语音分离,从而进一步减小对资源的占用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;中国科学技术大学,未经华为技术有限公司;中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010920160.3/2.html,转载请声明来源钻瓜专利网。