[发明专利]一种移动终端及其处理语音通信的方法有效
申请号: | 202010067617.0 | 申请日: | 2020-01-21 |
公开(公告)号: | CN110933233B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 李小兵;黄一火;冯子龙;许昊 | 申请(专利权)人: | 翱捷科技(上海)有限公司 |
主分类号: | H04M1/725 | 分类号: | H04M1/725;G10L21/007;G10L25/51 |
代理公司: | 上海恒锐佳知识产权代理事务所(普通合伙) 31286 | 代理人: | 殷晓雪 |
地址: | 201203 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 终端 及其 处理 语音 通信 方法 | ||
1.一种移动终端处理语音通信的方法,其特征是,包括如下步骤:
步骤S10:语音通信开始时,预置接收端的播放缓存区中的读指针和写指针位置,设置参考值和阈值;将读指针预置在写指针之前;所述阈值小于所述参考值;
步骤S20:每隔第一时间检测一次播放缓存区中的读指针和写指针的距离称为检测距离;
步骤S30:用偏移状态表示播放缓存区的历史状态,将偏移状态左移两位,根据检测距离与参考值和阈值之和或之差的比较结果,确定偏移状态的新取值;
步骤S40:根据VAD从语音PCM数据流中的检测情况,联合偏移状态决定进行样本数插值还是抽取;如果偏移状态表明播放缓存区的样本数偏多则进行样本数抽取;如果偏移状态表明播放缓存区的样本数偏少则进行样本数插值;
所述偏移状态是8位,用于记录连续4个播放缓存区的偏移状态;每2位表示一个播放缓存区的偏移状态,二进制10表示该播放缓存区的样本数偏多,二进制01表示该播放缓存区的样本数偏少;
所述步骤S40中,如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0xAA,则对播放缓存区中留存的样本进行抽取;
如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0x55,则对播放缓存区中留存的样本进行插值。
2.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S10中,将播放缓存区中的读指针预置在写指针之前3至10ms。
3.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述参考值表示在正常情况下读指针与写指针的距离;采样率为8k时,所述参考值设为160;采样率为16k时,所述参考值设为320。
4.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述阈值表示接收端的语音增强处理、解码完成所引入的波动范围;采样率为8k时,所述阈值设为8;采样率为16k时,所述阈值设为16。
5.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述第一时间为60ms或60ms的整数倍。
6.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S30中,所述偏移状态用来表征播放缓存区内的读指针与写指针的检测距离跟参考值相比是偏多还是偏少,偏移状态初始化为0。
7.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S30中,将参考值reference,阈值记为thesh,检测距离记为drift,偏移状态记为DriftState;
如果drift>reference+thesh,则将当前DriftState的取值左移两位后与0x2的或运算的结果作为DriftState的新取值;
如果drift<reference-thesh,则将当前DriftState的取值左移两位后与0x1的或运算的结果作为DriftState的新取值;
如果reference-thesh≤drift≤reference+thesh,则将当前DriftState的取值左移两位后作为DriftState的新取值。
8.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述第一数量的取值为4至8之间。
9.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S40中,如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0xAA,则对播放缓存区中留存的样本进行抽取,同时对采集缓存区中的样本进行插值;
如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0x55,则对播放缓存区中留存的样本进行插值,同时对采集缓存区中的样本进行抽取。
10.一种用于处理语音通信的移动终端,其特征是,包括初始设置单元、检测单元、偏移状态计算单元和调整单元;
所述初始设置单元用于在语音通信开始时,预置接收端的播放缓存区中的读指针和写指针位置,设置参考值和阈值;将读指针预置在写指针之前;所述阈值小于所述参考值;
所述检测单元用于每隔第一时间检测一次播放缓存区中的读指针和写指针的距离称为检测距离;
所述偏移状态计算单元用于采用偏移状态表示播放缓存区的历史状态,还用于将偏移状态左移两位,并根据检测距离与参考值和阈值之和或之差的比较结果,确定偏移状态的新取值;
所述调整单元用于根据VAD从语音PCM数据流中的检测情况,联合偏移状态决定进行样本数插值还是抽取;如果偏移状态表明播放缓存区的样本数偏多则进行样本数抽取;如果偏移状态表明播放缓存区的样本数偏少则进行样本数插值;
所述偏移状态是8位,用于记录连续4个播放缓存区的偏移状态;每2位表示一个播放缓存区的偏移状态,二进制10表示该播放缓存区的样本数偏多,二进制01表示该播放缓存区的样本数偏少;
如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0xAA,则对播放缓存区中留存的样本进行抽取;
如果VAD检测为非语音帧的数量连续地达到第一数量、且偏移状态为0x55,则对播放缓存区中留存的样本进行插值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于翱捷科技(上海)有限公司,未经翱捷科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010067617.0/1.html,转载请声明来源钻瓜专利网。