[发明专利]基于云端的语音处理方法和装置有效
申请号: | 201711079226.5 | 申请日: | 2017-11-06 |
公开(公告)号: | CN107919130B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 钱胜 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34;G10L15/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 云端 语音 处理 方法 装置 | ||
本发明提出一种基于云端的语音处理方法和装置,其中,方法包括:获取终端采集的待识别的语音;对待识别的语音进行语音识别;在语音识别的过程中,同时检测待识别的语音是否结束;当检测到待识别的语音结束时,将待识别的语音的识别结果反馈给终端。通过在语音的识别过程中,同时检测待识别的语音是否结束,从而可以保证语音识别的准确性。进一步地,由云端进行语音识别,与终端本地无关,因此和硬件平台无关,不存在迁移开发,且不受终端本地资源的限制,因此,云端使用的语音识别模型可以做的非常复杂精细,从而可以提升系统的抗干扰性能。此外,云端使用的语音识别模型,已经为不同的应用量身打造,无需重新训练模型,简化了开发量。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于云端的语音处理方法和装置。
背景技术
随着终端设备的不断发展,为了简化用户的操作,用户可以通过在终端中输入一段语音,而后,终端可以对该段语音进行识别,转化为对应的文本,从而用户可以根据转化的文本进行后续操作,例如上网、购物等。现有技术中,终端在本地通过语音端点检测(Voice Activity Detection,VAD)模型对语音进行识别,具体地,采用音频的时域能量信号判决语音的起点和尾点。
这种方式下,受限于终端本地的内存、存储空间以及计算能力,终端本地VAD模型只能使用简单的模型结构,导致对噪声的抗干扰性能较差,从而导致识别的准确性较低。此外,由于VAD模型在终端本地实现,当迁移到不同的硬件平台时,需要重新开发,导致成本较高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于云端的语音处理方法,以实现在语音的识别过程中,同时检测待识别的语音是否结束,从而可以保证语音识别的准确性。进一步地,由云端进行语音识别,与终端本地无关,因此和硬件平台无关,不存在迁移开发,且不受终端本地资源的限制,因此,云端使用的语音识别模型可以做的非常复杂精细,从而可以提升系统的抗干扰性能,进而可以进一步地提升语音识别的准确性。此外,云端使用的语音识别模型,已经为不同的应用量身打造,无需重新训练模型,简化了开发量,用于解决现有受限于终端本地的内存、存储空间、计算能力,终端本地VAD模型只能使用简单的模型结构,导致对噪声的抗干扰性能较差,从而导致识别的准确性较低。此外,由于VAD模型在终端本地实现,当迁移到不同的硬件平台时,需要重新开发,导致成本较高的技术问题。
本发明的第二个目的在于提出一种基于云端的语音处理装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机程序产品。
本发明的第五个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种基于云端的语音处理方法,包括:
获取终端采集的待识别的语音;
对所述待识别的语音进行语音识别;
在所述语音识别的过程中,同时检测所述待识别的语音是否结束;
当检测到所述待识别的语音结束时,将所述待识别的语音的识别结果反馈给所述终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711079226.5/2.html,转载请声明来源钻瓜专利网。