[发明专利]语音处理方法、装置、电子设备和存储介质在审

申请号：	202010235282.9	申请日：	2020-03-30
公开（公告）号：	CN111402908A	公开（公告）日：	2020-07-10
发明（设计）人：	李泽帅;黄远望	申请（专利权）人：	OPPO广东移动通信有限公司
主分类号：	G10L19/16	分类号：	G10L19/16;G10L19/26;G10L19/24;G10L15/26;G10L15/30;G10L15/05
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	石茵汀
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提出一种语音处理方法、装置、电子设备和存储介质，其中，方法包括：通过对语音采样得到的原始编码数据解码，得到解码音频数据；若确定解码音频数据的采样率和/或采样位数大于设定阈值，则对解码音频数据降采样，得到目标音频数据；向服务器端发送目标音频数据，以从服务器端获取对目标音频数据语音识别得到的文本。由此，通过对高采样率和/或高采样位数的音频数据进行降采样处理，进而将降采样后的目标音频数据传输至服务器端，以从服务器端获取语音识别得到的文本，从而减少了数据传输量，提高了数据传输速率。

技术领域

本申请涉及语音处理技术领域，尤其涉及一种语音处理方法、装置、电子设备和存储介质。

背景技术

语音文字转换(speech-to-text，简称STT)系统是一种将说出的单词转换为文本文件以供后续用途的方式。针对STT，目前常见的方案是直接将采集到的音频文件(如MP3，M4A，AMR等格式音频)传输至服务器，由服务器端对音频数据进行语音转换处理，并返回转换后的文本。

为了保证音质，在录制过程中会大幅度的提高采样率、采样位数以及比特率，从而导致传输的音频文件体积增大，增加了音频文件传输至服务器的过程中的负担，降低了传输效率。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

本申请第一方面实施例提出了一种语音处理方法，包括：

对语音采样得到的原始编码数据解码，得到解码音频数据；

若确定所述解码音频数据的采样率和/或采样位数大于设定阈值，则对所述解码音频数据降采样，得到目标音频数据；

向服务器端发送所述目标音频数据，以从所述服务器端获取对所述目标音频数据语音识别得到的文本。

作为本申请实施例的第一种可能的实现方式，所述对所述解码音频数据降采样，包括：