[发明专利]语音处理方法、装置、电子设备和存储介质在审
申请号: | 202010235282.9 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111402908A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 李泽帅;黄远望 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L19/26;G10L19/24;G10L15/26;G10L15/30;G10L15/05 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 电子设备 存储 介质 | ||
1.一种语音处理方法,其特征在于,所述方法包括:
对语音采样得到的原始编码数据解码,得到解码音频数据;
若确定所述解码音频数据的采样率和/或采样位数大于设定阈值,则对所述解码音频数据降采样,得到目标音频数据;
向服务器端发送所述目标音频数据,以从所述服务器端获取对所述目标音频数据语音识别得到的文本。
2.根据权利要求1所述的语音处理方法,其特征在于,所述对所述解码音频数据降采样,包括:
采用同步采样率转换SSRC算法,对所述解码音频数据降采样。
3.根据权利要求2所述的语音处理方法,其特征在于,所述采用同步采样率转换SSRC算法,对所述解码音频数据降采样,包括:
对所述解码音频数据中设定长度序列采用有限长单位冲激响应FIR滤波器滤波;
将滤波后得到的设定长度序列增加所述设定长度的目标序列,得到傅里叶变换的输入序列;其中,所述目标序列中各元素取值为零;
对所述输入序列进行快速傅里叶变换,得到频域序列;
对所述频域序列滤波后,进行快速傅里叶逆变换,以得到时域序列;
对所述时域序列,根据设定的降采样率重采样,得到所述目标音频数据。
4.根据权利要求1所述的语音处理方法,其特征在于,所述向服务器端发送所述目标音频数据之前,还包括:
若所述目标音频数据中包括双声道数据,剔除所述双声道数据中一个声道数据。
5.根据权利要求4所述的语音处理方法,其特征在于,所述剔除所述双声道数据中一个声道数据,包括:
确定所述目标音频数据中单一声道数据占用的数据长度;
对所述目标音频数据每间隔所述数据长度,剔除一段符合所述数据长度的数据。
6.根据权利要求1所述的语音处理方法,其特征在于,所述向服务器端发送所述目标音频数据之前,还包括:
根据所述目标音频数据,进行语音端点检测,以从所述目标音频数据中提取出浊音部分和清音部分,并去除静音部分;
其中,所述浊音部分的能量值大于第一能量阈值;
所述清音部分的能量值大于第二能量阈值;
所述第一能量阈值大于所述第二能量阈值。
7.根据权利要求1-6任一项所述的语音处理方法,其特征在于,所述向服务器端发送所述目标音频数据之前,还包括:
若所述目标音频数据的比特率低于设定比特率,则采用线性预测编码方式进行压缩编码;
若所述目标音频数据的比特率不低于所述设定比特率,则采用变换编码方式进行压缩编码。
8.一种语音处理装置,其特征在于,包括:
解码模块,用于对语音采样得到的原始编码数据解码,得到解码音频数据;
降采样模块,用于若确定所述解码音频数据的采样率和/或采样位数大于设定阈值,则对所述解码音频数据降采样,得到目标音频数据;
发送模块,用于向服务器端发送所述目标音频数据,以从所述服务器端获取对所述目标音频数据语音识别得到的文本。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-7中任一所述的语音处理方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的语音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010235282.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低复杂度的近阈值异或单元
- 下一篇:一种线路板分板装置