[发明专利]基于云端的语音处理方法和装置有效

申请号：	201711079226.5	申请日：	2017-11-06
公开（公告）号：	CN107919130B	公开（公告）日：	2021-12-17
发明（设计）人：	钱胜	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L15/34	分类号：	G10L15/34;G10L15/22
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	宋合成
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于云端语音处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种基于云端的语音处理方法和装置，其中，方法包括：获取终端采集的待识别的语音；对待识别的语音进行语音识别；在语音识别的过程中，同时检测待识别的语音是否结束；当检测到待识别的语音结束时，将待识别的语音的识别结果反馈给终端。通过在语音的识别过程中，同时检测待识别的语音是否结束，从而可以保证语音识别的准确性。进一步地，由云端进行语音识别，与终端本地无关，因此和硬件平台无关，不存在迁移开发，且不受终端本地资源的限制，因此，云端使用的语音识别模型可以做的非常复杂精细，从而可以提升系统的抗干扰性能。此外，云端使用的语音识别模型，已经为不同的应用量身打造，无需重新训练模型，简化了开发量。

技术领域

本发明涉及语音处理技术领域，尤其涉及一种基于云端的语音处理方法和装置。

背景技术

随着终端设备的不断发展，为了简化用户的操作，用户可以通过在终端中输入一段语音，而后，终端可以对该段语音进行识别，转化为对应的文本，从而用户可以根据转化的文本进行后续操作，例如上网、购物等。现有技术中，终端在本地通过语音端点检测(Voice Activity Detection，VAD)模型对语音进行识别，具体地，采用音频的时域能量信号判决语音的起点和尾点。

这种方式下，受限于终端本地的内存、存储空间以及计算能力，终端本地VAD模型只能使用简单的模型结构，导致对噪声的抗干扰性能较差，从而导致识别的准确性较低。此外，由于VAD模型在终端本地实现，当迁移到不同的硬件平台时，需要重新开发，导致成本较高。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的第一个目的在于提出一种基于云端的语音处理方法，以实现在语音的识别过程中，同时检测待识别的语音是否结束，从而可以保证语音识别的准确性。进一步地，由云端进行语音识别，与终端本地无关，因此和硬件平台无关，不存在迁移开发，且不受终端本地资源的限制，因此，云端使用的语音识别模型可以做的非常复杂精细，从而可以提升系统的抗干扰性能，进而可以进一步地提升语音识别的准确性。此外，云端使用的语音识别模型，已经为不同的应用量身打造，无需重新训练模型，简化了开发量，用于解决现有受限于终端本地的内存、存储空间、计算能力，终端本地VAD模型只能使用简单的模型结构，导致对噪声的抗干扰性能较差，从而导致识别的准确性较低。此外，由于VAD模型在终端本地实现，当迁移到不同的硬件平台时，需要重新开发，导致成本较高的技术问题。

本发明的第二个目的在于提出一种基于云端的语音处理装置。

本发明的第三个目的在于提出一种计算机设备。

本发明的第四个目的在于提出一种计算机程序产品。

本发明的第五个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的，本发明第一方面实施例提出了一种基于云端的语音处理方法，包括：

获取终端采集的待识别的语音；

对所述待识别的语音进行语音识别；

在所述语音识别的过程中，同时检测所述待识别的语音是否结束；

当检测到所述待识别的语音结束时，将所述待识别的语音的识别结果反馈给所述终端。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】