[发明专利]语音处理方法、装置、电子设备和存储介质在审

申请号：	202010235282.9	申请日：	2020-03-30
公开（公告）号：	CN111402908A	公开（公告）日：	2020-07-10
发明（设计）人：	李泽帅;黄远望	申请（专利权）人：	OPPO广东移动通信有限公司
主分类号：	G10L19/16	分类号：	G10L19/16;G10L19/26;G10L19/24;G10L15/26;G10L15/30;G10L15/05
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	石茵汀
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音处理方法，其特征在于，所述方法包括：

对语音采样得到的原始编码数据解码，得到解码音频数据；

若确定所述解码音频数据的采样率和/或采样位数大于设定阈值，则对所述解码音频数据降采样，得到目标音频数据；

向服务器端发送所述目标音频数据，以从所述服务器端获取对所述目标音频数据语音识别得到的文本。

2.根据权利要求1所述的语音处理方法，其特征在于，所述对所述解码音频数据降采样，包括：

采用同步采样率转换SSRC算法，对所述解码音频数据降采样。

3.根据权利要求2所述的语音处理方法，其特征在于，所述采用同步采样率转换SSRC算法，对所述解码音频数据降采样，包括：

对所述解码音频数据中设定长度序列采用有限长单位冲激响应FIR滤波器滤波；

将滤波后得到的设定长度序列增加所述设定长度的目标序列，得到傅里叶变换的输入序列；其中，所述目标序列中各元素取值为零；

对所述输入序列进行快速傅里叶变换，得到频域序列；

对所述频域序列滤波后，进行快速傅里叶逆变换，以得到时域序列；

对所述时域序列，根据设定的降采样率重采样，得到所述目标音频数据。

4.根据权利要求1所述的语音处理方法，其特征在于，所述向服务器端发送所述目标音频数据之前，还包括：

若所述目标音频数据中包括双声道数据，剔除所述双声道数据中一个声道数据。

5.根据权利要求4所述的语音处理方法，其特征在于，所述剔除所述双声道数据中一个声道数据，包括：

确定所述目标音频数据中单一声道数据占用的数据长度；

对所述目标音频数据每间隔所述数据长度，剔除一段符合所述数据长度的数据。

6.根据权利要求1所述的语音处理方法，其特征在于，所述向服务器端发送所述目标音频数据之前，还包括：

根据所述目标音频数据，进行语音端点检测，以从所述目标音频数据中提取出浊音部分和清音部分，并去除静音部分；

其中，所述浊音部分的能量值大于第一能量阈值；

所述清音部分的能量值大于第二能量阈值；

所述第一能量阈值大于所述第二能量阈值。

7.根据权利要求1-6任一项所述的语音处理方法，其特征在于，所述向服务器端发送所述目标音频数据之前，还包括：

若所述目标音频数据的比特率低于设定比特率，则采用线性预测编码方式进行压缩编码；

若所述目标音频数据的比特率不低于所述设定比特率，则采用变换编码方式进行压缩编码。

8.一种语音处理装置，其特征在于，包括：

解码模块，用于对语音采样得到的原始编码数据解码，得到解码音频数据；

降采样模块，用于若确定所述解码音频数据的采样率和/或采样位数大于设定阈值，则对所述解码音频数据降采样，得到目标音频数据；

发送模块，用于向服务器端发送所述目标音频数据，以从所述服务器端获取对所述目标音频数据语音识别得到的文本。

9.一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如权利要求1-7中任一所述的语音处理方法。

10.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的语音处理方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司，未经OPPO广东移动通信有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010235282.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载